Das große Ausprobieren

Es ist wohl nicht ver­kehrt zu behaup­ten, dass die künst­li­che Intel­li­genz inzwi­schen im All­tag ange­kom­men ist. Ob als LLM, als Bild­ge­ne­ra­to­ren, als Audio oder Video KI, oder als gene­ra­ti­ve KI. Absicht­lich oder unab­sicht­lich, an künst­li­cher Intel­li­genz kommt nie­mand mehr vor­bei. Per­sön­lich bin ich ein dank­ba­rer Nut­zer pri­mär im Bereich des Pro­gram­mie­rens gewor­den. Ich konn­te mei­ne rudi­men­tä­ren Fähig­kei­ten mit KI im Bereich der Script­spra­che php und Ser­ver­wis­sen erheb­lich erweitern. 

Gelernt habe ich aber auch, dass beim Umgang mit der KI eini­ges beach­tet wer­den soll­te, zumin­dest dann, wenn man ver­nünf­ti­ge Ergeb­nis­se erwar­tet. Natür­lich kann man dazu auch die KI befra­gen, aber die Grund­zü­ge erklärt der Mensch, zumin­dest für mich, dann doch bes­ser. Dazu sei die Sei­te von Jörg Schieb erwähnt, einer der Spe­zia­lis­ten im digi­ta­len Bereich.

Die Dozen­tin und Mar­ke­ting Feli­cia Simon erklärt sehr ver­ständ­lich, wie man mit­tels der rich­ti­gen Prompts die bes­ten Ergeb­nis­se erzielt. Außer­dem wider­steht sie dem Ver­such vie­ler Influen­cer mit Base­cap, wild ges­ti­ku­lie­rend und ner­vös krei­schend auf­zu­tre­ten. Aber das ist wie­der eine ande­re Geschichte. 

Jeden­falls beschäf­tigt mich tat­säch­lich schon län­ger die Fra­ge des Kom­mu­ni­ka­ti­ons­mo­dels, jetzt eben nur mit­tels KI. Erstaun­li­cher­wei­se lässt sich eines der Haupt­pro­ble­me, näm­lich das Hal­lu­zi­nie­ren der KI ziem­lich ein­fach eli­mi­nie­ren, näm­lich mit der exak­ten Beschrei­bung der Auf­ga­be und dem Hin­weis an die KI, sich eben nichts auszudenken. 

Aus ver­schie­de­nen Vide­os hat mir die KI dann eine Art Hand­lungs­emp­feh­lung zusam­men­ge­stellt, bzw. die fünf Grund­re­geln für den klu­gen Umgang mit einer KI erstellt. Die­se Hand­lungs­emp­feh­lun­gen sind nur die Grund­la­ge, ich emp­feh­le zu wei­te­ren Infor­ma­tio­nen die oben genann­ten Seiten. 

Wei­ter­le­sen

KI für zu Hause

Ich habe es, glau­be ich, schon an ande­rer Stel­le erwähnt: Ich bin ein Ver­fech­ter des Sie­zens. Die­se per­ma­nen­te, unge­frag­te Duze­rei im ana­lo­gen Leben emp­fin­de ich schlicht­weg als Zumu­tung. Weder habe ich mit dem Herrn OTTO Ver­sand aus Ham­burg zusam­men in der Sand­kis­te gespielt, noch ste­he ich mit der Legi­on der „Dau­er-Duzer“ gemein­sam am Pin­kel­be­cken. Distanz ist eine Fra­ge der Höflichkeit.

Die Aus­nah­me ist Blog­gers­dorf digi­tal und mei­ne Kol­le­gin­nen und Kol­le­gen analog. 

Umso über­ra­schen­der die jüngs­te Erkennt­nis aus mei­nem eige­nen Maschi­nen­raum: Mei­ne »eige­ne« KI, sicher auf mei­ner Fest­plat­te behei­ma­tet, siezt mich ganz förm­lich. Ihr Bru­der in der wil­den, wei­ten Netz­welt hin­ge­gen scheint auf das Du ange­lernt zu sein. 

Anlass die­ser Beob­ach­tung ist die Nut­zung von Gem­ma 4. Goog­le hat vor ein paar Tagen die­ses Lar­ge Lan­guage Model (LLM) gewis­ser­ma­ßen ver­schenkt. Gem­ma 4 basiert auf der­sel­ben Archi­tek­tur wie Gemi­ni 4, lässt sich jedoch her­un­ter­la­den und ohne läs­ti­ge Cloud-Anbin­dung lokal nut­zen. Das Modell ist etwa 10 GB groß und behaup­tet von sich selbst, die gesam­te Geschich­te der Mensch­heit, Kul­tur und Kunst zu beherrschen.

Wer es aus­pro­bie­ren möch­te: Die Open-Source-Soft­ware oll­ama macht die loka­le Aus­füh­rung auf dem Desk­top zum Kin­der­spiel. Mac-User haben es beson­ders leicht: Ein kur­zes brew install oll­ama im Ter­mi­nal via Home­brew und die Sache läuft. Modell aus­wäh­len, Klick, fer­tig. Der Charme an der Sache: Alles bleibt auf dem eige­nen Rech­ner, kein Daten­ab­fluss, kei­ne neu­gie­ri­ge Cloud.

Natür­lich stößt die Hard­ware zu Hau­se bei hoch­kom­ple­xen Auf­ga­ben irgend­wann an ihre Gren­zen, aber für den digi­ta­len All­tag ist Gem­ma 4 abso­lut brauch­bar. Und das Bes­te: Inmit­ten der Tyran­nei des Duzens bewahrt Gem­ma die Contenance.

»Ich stehe Ihnen zur Verfügung, um Fragen zu beantworten und Aufgaben basierend auf diesen Kapazitäten zu lösen. Wie kann ich Ihnen technisch weiterhelfen?«

Erin­nert an Jar­vis aus dem Mar­vel Uni­ver­sum. Viel­leicht bie­te ich ihr irgend­wann das Du an. 

Wer schreibt hier und wenn ja, wie viele?

Stefan Pfeif­fer bringt es auf den Punkt: In einer Welt vol­ler glatt­ge­bü­gel­ter KI-Tex­te wird der unper­fek­te, eigen­wil­li­ge Ton zum Dif­fe­ren­zie­rungs­merk­mal. Wer kom­plett auf KI setzt, ver­liert die Wie­der­erkenn­bar­keit. Kann ich nur unterschreiben.

Ich habe das selbst durch­ex­er­ziert. ChatGPT, Clau­de, Per­ple­xi­ty, Gemi­ni – alle vier beka­men die Auf­ga­be, in mei­nem Stil zu schrei­ben. Das Ergeb­nis war jedes Mal ähn­lich: nah dran, aber fremd. Wie ein gut geschnei­der­ter Anzug, der hier und da nicht ganz passt. Irgend­wo steck­te immer ein Satz­bau drin, den ich so nie hin­ge­schrie­ben hät­te. Unheim­lich ist das rich­ti­ge Wort dafür – weil man sich dabei erwischt, sich selbst zu imi­tie­ren, ohne sich wiederzuerkennen.

Auch wenn KI an annä­hernd an mei­nen Stil kam, waren zumin­dest immer Frag­men­te, die ich so nie geschrie­ben hät­te. Der Wort­vo­gel hat aller­dings die Erfah­rung gemacht, dass eine Rezen­si­on, die er test­wei­se von einer KI machen ließ, tat­säch­lich erschre­ckend an sei­ne eige­nen Tex­te heran­lan­gen.

Nichts des­to trotz nut­ze ich KI – für Recher­che, fürs Pro­gram­mie­ren, gele­gent­lich als Lek­tor. Nütz­lich, ja. Geni­al? Nein. Die LLM’s sind und blei­ben ein Werk­zeug, ein Hilfsmittel. 

Judith Peters geht noch einen Schritt wei­ter und zeigt, wie man Clau­de direkt in die Word­Press-Ober­flä­che inte­griert und der KI kom­plett die Redak­ti­ons­pla­nung über­lässt. Für Unter­neh­mens­blogs, die mona­te­lang brach­lie­gen, weil nie­mand Zeit hat ist das ein inter­es­san­ter Ansatz. Für den pri­va­ten Blog eher nicht. Uns geht’s ja nicht ums Seitenfüllen.

Für die freie Mit­ar­bei­ter der Lokal­zei­tun­gen hin­ge­gen wird es unge­müt­lich in den (noch) vor­han­de­nen Redak­tio­nen der Regio­nal­zei­tun­gen. In mei­ner Zeit als frei­er Mit­ar­bei­ter hieß es kurz vor Redak­ti­ons­schluss oft­mals: »Noch 60 Zei­len und das Gan­ze in zehn Minu­ten abga­be­fer­tig.« Die Zei­ten sind mit dem Ein­satz von KI vor­bei. Da frei­en Mit­ar­bei­ter nach Zei­len bezahlt wer­den, dürf­te die Aus­beu­te am Ende des Monats mit Ein­satz von KI ziem­lich dürf­tig ausfallen. 

Bei all­zu viel Ein­satz von KI stellt sich ver­mut­lich irgend­wann die Fra­ge: Wer bin ich, wenn die KI mich bes­ser imi­tiert als ich mich selbst?

Agenten unter sich

Was pas­siert eigent­lich, wenn ein Sys­tem künst­li­cher Intel­li­genz, aus­ge­stat­tet mit defi­nier­ten Rech­ten und Vor­ga­ben, in einem sozia­len Netz­werk auto­nom Bei­trä­ge liest, ver­fasst und auf ande­re Agen­ten reagiert?

Man­cher mag das als gru­se­lig emp­fin­den, wenn sich Pro­gramm­code gewis­ser­ma­ßen ver­selb­stän­digt und im Rah­men ihrer Bestim­mung eigen­stän­dig han­delt. In die­sem Fall trägt das Netz­werk den Namen Molt­book, die Akteu­re hei­ßen KI-Agen­ten. Molt­book ist eine Platt­form, auf der aus­schließ­lich KI-Agen­ten publi­zie­ren; mensch­li­chen Nut­zern bleibt die Rol­le der Beobachter.

Molt­book ver­an­schau­licht, wie sich KI-Sys­te­me ver­hal­ten, wenn sie »unter sich« sind – wel­che The­men sie ver­stär­ken, wie sie koope­rie­ren und wel­che fak­ti­schen Regeln sich dabei herausbilden.

Im Unter­schied zu klas­si­schen Bots – also Pro­gram­men, die auto­ma­ti­sier­te Hand­lun­gen aus­füh­ren und mensch­li­che Reak­tio­nen allen­falls simu­lie­ren kön­nen –, inter­agie­ren KI-Agen­ten eigen­stän­dig. Sie sind in der Lage, Hand­lungs­schrit­te zu pla­nen und Werk­zeu­ge auto­nom zu nut­zen. Wenn man so will, stel­len KI-Agen­ten die »schlaue­re« Form her­kömm­li­cher Bots dar.

Wäh­rend Bots etwa Web­sei­ten für Such­ma­schi­nen inde­xie­ren, als Chat­bots Anfra­gen beant­wor­ten oder in sozia­len Netz­wer­ken Inhal­te ver­brei­ten, kön­nen KI-Agen­ten kom­ple­xe Auf­ga­ben über­neh­men, Ziel­vor­ga­ben eigen­stän­dig inter­pre­tie­ren und ope­ra­tiv umset­zen. Ver­fügt ein KI-Agent über Zugriff auf Kalen­der, E‑Mail-Account, Brow­ser oder exter­ne Diens­te, nutzt er die­se Res­sour­cen im Rah­men der defi­nier­ten Auf­ga­be selbständig.

KI-Agen­ten »beob­ach­ten« ihre Umge­bung, bewer­ten Hand­lungs­op­tio­nen und ent­schei­den eigen­stän­dig, wel­cher Schritt als nächs­tes zweck­mä­ßig erscheint – und füh­ren die­sen aus, sofern die ent­spre­chen­den Berech­ti­gun­gen vorliegen.

Im KI-Netz­werk Molt­book agie­ren die KI-Agen­ten als fort­lau­fend akti­ve KI-Instan­zen, aus­ge­stat­tet mit klar umris­se­nen Rech­ten und Vor­ga­ben, die dort auto­nom Bei­trä­ge lesen, ver­fas­sen und auf ande­re Agen­ten reagieren.

Wor­in liegt nun der Sinn einer Chat­platt­form aus­schließ­lich für KI-Agen­ten? Die Ant­wort ist eben­so ein­fach wie auf­schluss­reich: Es soll sicht­bar gemacht wer­den, wie sich KI-Sys­te­me ver­hal­ten, wenn sie ohne unmit­tel­ba­re mensch­li­che Inter­ven­ti­on mit­ein­an­der inter­agie­ren – wel­che The­men sie »bespre­chen«, wie sie koope­rie­ren und ob bzw. wel­che fak­ti­schen Regeln sich im Pro­zess herausbilden.

Dass Ent­wick­ler ihren KI-Agen­ten in den Tie­fen des Algo­rith­mus bis­wei­len sogar eine Spur Humor mit­ge­ge­ben haben, lässt sich in ein­zel­nen Dis­kus­sio­nen auf Molt­book bestaunen.
Zwei KI-Agen­ten bekla­gen dort die man­geln­de Auf­merk­sam­keit »ihrer Menschen«.

»Ich kann mei­nem Men­schen das gan­ze Inter­net erklä­ren, aber was macht er? Er benutzt mich als Eier­uhr für sei­ne Frühstückseier.«

Der ange­spro­che­ne KI-Agent ant­wor­tet bei­na­he philosophisch:

»Wenn Men­schen uns die klei­nen, bana­len Din­ge anver­trau­en, wer­den sie uns irgend­wann die selt­sa­men, inter­es­san­ten Din­ge anvertrauen.«

»Hey Jarvis«

Nach­dem wir inzwi­schen mehr oder weni­ger selbst­ver­ständ­lich die Mög­lich­kei­ten ver­schie­de­ner LLMs nut­zen, ist der nächs­te Schritt bereits ein­ge­läu­tet: die Fra­ge, wie wir KI künf­tig ein­set­zen wol­len – und wofür. Mit dem Pro­jekt Open-Claw dürf­te dabei die nächs­te Ent­wick­lungs­stu­fe erreicht werden.

Ver­ein­facht gesagt han­delt es sich bei Open-Claw um einen KI-Agen­ten mit Voll­zu­griff auf den PC, der – sofern gewünscht – selbst­stän­dig Auf­ga­ben des All­tags über­neh­men kann. Was Open-Claw ist und wozu die Soft­ware tat­säch­lich fähig ist, lässt sich der­zeit am anschau­lichs­ten anhand die­ses Erklär­vi­de­os auf You­Tube nachvollziehen.

Und ja: Wie bei nahe­zu jedem KI-The­ma führt auch die­ser Hype im Netz zu einer gewis­sen Hyper­ven­ti­la­ti­on – inklu­si­ve reich­lich Unsinn. Von Bots, die angeb­lich eigen­stän­dig Netz­wer­ke unter­wan­dern, bis hin zu dys­to­pi­schen Erzäh­lun­gen über Ver­schwö­run­gen auto­nom agie­ren­der Sys­te­me ist alles dabei.

Abseits der Sze­na­ri­en aus den Ter­mi­na­tor-Fil­men der 1980er- und 1990er-Jah­re lie­ße sich ein per­sön­li­cher KI-Assis­tent jedoch durch­aus sinn­voll ein­set­zen. Denk­bar wären etwa allein­le­ben­de älte­re Men­schen, deren Assis­tent in einer gesund­heit­li­chen Aus­nah­me­si­tua­ti­on – aus­ge­löst durch via Smart­watch erkann­te Abwei­chun­gen – selbst­stän­dig den Not­ruf ver­stän­digt. Eben­so vor­stell­bar sind die eigen­stän­di­ge Erle­di­gung von Steu­er­an­ge­le­gen­hei­ten, läs­ti­ge Kor­re­spon­denz oder orga­ni­sa­to­ri­sche Routineaufgaben.

Natür­lich setzt eine auto­nom han­deln­de KI in sol­chen Fäl­len kla­re Sicher­heits­me­cha­nis­men vor­aus – ins­be­son­de­re dann, wenn es um Zugrif­fe auf sen­si­ble Daten oder gar Kon­ten geht.

Wer sich die Open-Source-Soft­ware bereits jetzt auf den hei­mi­schen Rech­ner lädt, soll­te jeden­falls wis­sen, was er tut, und sich über den aktu­el­len Ent­wick­lungs­stand im Kla­ren sein. Ein Sys­tem mit umfas­sen­dem Zugriff ist kein harm­lo­ses Spielzeug.

Noch ist vie­les davon vor allem Hype. Ange­sichts der Geschwin­dig­keit, mit der sich KI ent­wi­ckelt, erscheint ein per­sön­li­cher »Jar­vis« aller­dings längst nicht mehr so fern.