Wie Sprachmodelle unsere Gesellschaft verändern werden

Ein Blick ins Klassenzimmer

Mar­tha hat eine Eng­lisch­haus­auf­ga­be bekom­men. Sie soll einen Text über die drei bekann­tes­ten Sehens­wür­dig­kei­ten von New York schrei­ben. New York steht im Zen­trum der aktu­el­len Unit im Eng­lisch­buch. Mar­tha ist nicht sehr gut in Eng­lisch. Aber die App auf ihrem Han­dy ist direkt an ChatGPT ange­dockt. ChatGPT ist eine künst­li­che Intel­li­genz, die auf mög­lichst natür­li­che Text­aus­ga­be opti­miert ist. Mar­tha tippt in ihre App: „Wri­te an artic­le about the three most famous sights in New York.“, denn das ist die Auf­ga­ben­stel­lung, die ihre Leh­re­rin ihr gege­ben hat. Her­aus kommt fol­gen­der Text (abge­druckt ist die unver­än­der­te Ausgabe):

New York City is one of the world’s most vibrant and exci­ting desti­na­ti­ons. Known for its diver­se cul­tu­re, bust­ling streets, and ico­nic land­marks, the city is a hub of enter­tain­ment and com­mer­ce. From the bright lights of Times Squa­re to the gran­deur of the Sta­tue of Liber­ty, New York offers a wealth of sights to explo­re. In this artic­le, we will take a clo­ser look at the three most famous sights in the city.

1. The Sta­tue of Liberty

The Sta­tue of Liber­ty is one of the most ico­nic land­marks in New York City. Loca­ted on Liber­ty Island, the sta­tue was gifted to the United Sta­tes by the peo­p­le of France in 1886 as a sym­bol of free­dom and demo­cra­cy. The sta­tue is 151 feet tall and is made of cop­per pla­tes, which have tur­ned green over time due to weathering.

Visi­tors can take a fer­ry to Liber­ty Island and climb to the top of the pedes­tal or even to the crown of the sta­tue for pan­o­r­amic views of the city sky­line and har­bor. The sta­tue is also visi­ble from Bat­tery Park in Lower Man­hat­tan, whe­re visi­tors can take in the stun­ning view of the sta­tue against the back­drop of the city.

1. The Empire Sta­te Building

The Empire Sta­te Buil­ding is a towe­ring sky­scra­per loca­ted in Mid­town Man­hat­tan. It was com­ple­ted in 1931 and was the world’s tal­lest buil­ding until 1971. The buil­ding stands at 1,454 feet tall and has 102 flo­ors. Visi­tors can take an ele­va­tor to the obser­va­ti­on deck on the 86th flo­or for breath­ta­king views of the city sky­line. On a clear day, visi­tors can see up to 80 miles in every direction.

The Empire Sta­te Buil­ding has been fea­tured in num­e­rous movies and is a popu­lar tou­rist desti­na­ti­on. The building’s art deco archi­tec­tu­re is a sight to behold, and the night­ti­me light­ing dis­play is an ico­nic part of the city skyline.

1. Cen­tral Park

Cen­tral Park is a vast green space loca­ted in the heart of Man­hat­tan. The park covers 843 acres and is a popu­lar desti­na­ti­on for both locals and tou­rists. Visi­tors can explo­re the park on foot, by bike, or even by hor­se-drawn car­ria­ge. The park fea­tures num­e­rous wal­king paths, gar­dens, lakes, and ponds, as well as famous land­marks such as the Cen­tral Park Zoo and the Bethes­da Fountain.

In the win­ter, visi­tors can go ice-ska­ting at the Woll­man Rink, and in the sum­mer, the­re are num­e­rous con­certs and events held in the park. Cen­tral Park is a wel­co­me respi­te from the hust­le and bust­le of the city and pro­vi­des a tran­quil oasis in the heart of Manhattan.

In con­clu­si­on, New York City is home to many famous sights, but the Sta­tue of Liber­ty, Empire Sta­te Buil­ding, and Cen­tral Park are three of the most ico­nic. The­se land­marks repre­sent the city’s histo­ry, cul­tu­re, and natu­ral beau­ty and are must-see desti­na­ti­ons for anyo­ne visi­ting the city. Whe­ther you’­re a first-time visi­tor or a lifel­ong New Yor­ker, the­se sights never cea­se to ama­ze and inspire.

Mar­tha mel­det sich und liest ihren Text vor. Ihre Lehr­kraft ist ver­wun­dert. Die­ser Text ent­spricht über­haupt nicht Mart­has bis­her im Unter­richt gezeig­ten Fähig­kei­ten. Sie hat den Ver­dacht, dass die­ser Text von irgend­wo­her kopiert sein könn­te – fin­det im Netz aber nichts. Mar­tha erhält eine gute Note.

Han­nes und Fred prä­sen­tie­ren ihren Text im Unter­richt. Eigent­lich lässt sich zum Inhalt wenig Schlech­tes sagen, aber das Geschrie­be­ne erin­nert dann doch mehr an Gespro­che­nes: Satz­zei­chen­in­fla­ti­on am Satz­en­de, kaum Groß- und Klein­schrei­bung und die Zei­chen­set­zung ist opti­mier­bar – oder gar nicht erst vor­han­den. Han­nes und Fred kopie­ren ihren Text dar­auf­hin in https://www.deepl.com/write . Das ist ein KI-basier­ter Web­dienst, der kei­ne Daten sam­melt und bis 2000 Zei­chen kos­ten­los ohne Account nutz­bar ist. Deepl ist eigent­lich ein sehr gutes Über­set­zungs­werk­zeug, kann in einer Beta­ver­si­on jetzt aber auch Tex­te sti­lis­tisch über­ar­bei­ten. Han­nes und Fred schau­en sich die vor­ge­schla­ge­nen Ände­run­gen an. Eini­ges gefällt ihnen, eini­ges scheint den Sinn ihres Tex­tes zu stark zu ver­än­dern. Sie ent­schei­den sich dazu, eini­ge Pas­sa­gen zu ändern, weil sie durch die Ände­run­gen wirk­lich bes­ser klingen.

Die­se bei­den Bei­spie­le zei­gen, was heu­te für alle bereits mit sprach­ba­sier­ter künst­li­cher Intel­li­genz mög­lich ist. Wäh­rend das ers­te Bei­spiel in vie­len Kol­le­gi­en in deut­schen Schu­len für Auf­ruhr sorgt, wenn das Poten­ti­al von Sprach­mo­del­len dort über­haupt ankommt, zeigt das zwei­te Bei­spiel, dass Sprach­mo­del­le gera­de unsi­che­re Schrei­ber sehr gut unter­stüt­zen könnten.

Die Auseinandersetzung über ChatGPT in sozialen Netzwerken

Zwi­schen die­sen bei­den Polen bewe­gen sich manch­mal emo­tio­nal sehr auf­ge­la­de­ne Dis­kus­sio­nen in sozia­len Netz­wer­ken. Die einen sehen bestehen­de Struk­tu­ren und Auf­ga­ben­for­ma­te in Gefahr, die ande­re expe­ri­men­tie­ren mutig mit den sich erge­ben­den neu­en Mög­lich­kei­ten. Die­se Expe­ri­men­te bewe­gen sich oft pri­mär auf einer phä­no­me­no­lo­gi­schen Ebe­ne: Im Kern geht es dar­um, die Ein­ga­ben („Prompts“) zu fin­den, die eine vor­her erdach­te Auf­ga­ben­stel­lung mit Hil­fe eines Sprach­mo­dells opti­mal lösen.

Natür­lich bleibt die Aus­ein­an­der­set­zung vor­erst phä­no­me­no­lo­gisch. Man gibt sich Tipps, wel­che Ein­ga­ben zu einem gewünsch­ten Ergeb­nis füh­ren und wie der Chat­Bot in z.B. eine ande­re Rol­le ein­neh­men kann. Das klappt auf der Ober­flä­che. Die tech­ni­schen Abläu­fe in einem Sprach­mo­dell sind gar nicht so leicht zu verstehen.

Was ist ein Sprachmodell eigentlich?

Ein Sprach­mo­dell ist eine sehr kom­ple­xe Soft­ware, die zur Klas­se der künst­li­chen Intel­li­genz gezählt wird. Schon der Begriff „Intel­li­genz“ ist je nach Fach­dis­zi­plin nicht ein­fach zu defi­nie­ren. Daher spre­chen eini­ge Fach­leu­te lie­ber von „maschi­nel­lem Ler­nen“, was das Defi­ni­ti­ons­pro­blem jedoch ledig­lich auf den Begriff des Ler­nens ver­schiebt. Als Aus­weg aus die­sem Dilem­ma haben eine Rei­he von Autor:innen nicht nur aus dem Infor­ma­tik­um­feld fol­gen­de Arbeits­de­fi­ni­ti­on für künst­li­che Intel­li­genz vorgeschlagen:

Künst­li­che Intel­li­genz bezeich­net die Fähig­keit von Com­pu­ter­sys­te­men, auf sie zuge­schnit­te­ne Auf­ga­ben selbst­tä­tig zu lösen, die auf­grund ihrer Kom­ple­xi­tät bis­lang mensch­li­che Fähig­kei­ten erfor­der­ten”1

Ange­wen­det: Sprach­mo­del­le lösen nun selbst­stän­dig das Pro­blem der Erstel­lung von Tex­ten auf Basis von Ein­ga­ben, die Nutzer:innen vor­ge­ben. Aber wie machen sie das?

In den Anfangs­zei­ten von künst­li­cher Intel­li­genz waren die Auf­ga­ben und Mög­lich­kei­ten von IT-Sys­te­men noch etwas beschränk­ter. Ein sehr ein­fa­ches Bei­spiel sind die dama­li­gen Obst­waa­gen in den Fri­sche­ab­tei­lun­gen der Super­märk­te. Der Kun­de füll­te eine Ware in einen Beu­tel, ging zur einer Waa­ge, leg­te den Beu­tel auf und drück­te eine Tas­te mit einem Sym­bol oder einer Num­mer. Die Waa­ge druck­te dann einen Kas­sen­zet­tel mit Strich­code aus. Es waren aber nicht alle Kun­den ehr­lich, so dass man auf die Idee kam, die­se Waa­gen durch eine Kame­ra zu ergän­zen, mit deren Hil­fe die auf­ge­leg­te Ware erkannt wer­den konn­te, z.B. anhand von Grö­ße oder Far­be. Im Prin­zip konn­te man drei Fäl­le unterscheiden:

a) Wenn der Tas­ten­druck des Kun­den zur erkann­ten Ware pass­te, war die Ent­schei­dung eindeutig.

b) Wenn der Tas­ten­druck ein­deu­tig nicht zur auf­ge­leg­ten Ware pass­te, konn­te ein alter­na­ti­ver Kas­sen­zet­tel gedruckt werden.

c) Wenn die Erken­nung selbst unein­deu­tig war, d.h. zwei Pro­duk­te in Fra­ge kom­men wür­den, aber der Kun­de z.B. die Tas­te mit dem teu­re­ren Pro­dukt gedrückt hat, wur­de natür­lich die teu­re­re Vari­an­te gewählt – gleich­zei­tig ließ sich die­se Situa­ti­on abspei­chern, so dass sie für die Zukunft mit berück­sich­tigt wer­den konnte.

Die­se Waa­ge erzeug­te also auf Basis von Ein­ga­ben und der Bil­der der Kame­ra (Ein­ga­be­schicht) Daten, die sie ver­ar­bei­te­te (Ver­ar­bei­tungs­schicht). Bei der Ver­ar­bei­tung flos­sen die Ein­ga­be­da­ten eben­so ein, wie gespei­cher­te Fäl­le aus einer Daten­bank. Die Daten wur­den unter­ein­an­der gewich­tet, mit einer Daten­bank vol­ler Stan­dard­fäl­le abge­gli­chen und dann eine Aus­ga­be in Form eines Kas­sen­zet­tels erzeugt (Ausgabeschicht).Mit einer gewis­sen Wahr­schein­lich­keit stimm­ten dann Kas­sen­zet­tel und Pro­dukt tat­säch­lich über­ein. Die Wahr­schein­lich­keit der Über­ein­stim­mung war umso grö­ßer, je mehr Stan­dard­fäl­le in der Daten­bank der Waa­ge erfasst wur­den und je mehr Ein­ga­ben die „intel­li­gen­te Waa­ge“ bereits ver­ar­bei­tet hat­te. Softwarentwickler:innen konn­ten die Stan­dard­fäl­le in Form einer Daten­bank vorgeben.

Sprach­mo­del­le funk­tio­nie­ren nach einem ähn­li­chen Prin­zip, nur dass die Stan­dard­fäl­le und Aus­ga­ben ungleich kom­ple­xer sind als bei dem Bei­spiel der Waa­ge. Zudem ist ver­hält­nis­mä­ßig wenig dar­über bekannt, mit wel­chen Daten die zugrun­de­lie­gen­den Daten­ban­ken gefüllt wur­den. Letzt­lich gilt aber auch hier, dass die Aus­ga­ben ledig­lich mit einer gewis­sen Wahr­schein­lich­keit kor­rekt sind oder gar zur Anfra­ge des Nut­zen­den pas­sen – daher ver­hal­ten sich Han­nes und Fred deut­lich smar­ter als Martha.

Es mag auf den ers­ten Blick erstau­nen, dass Sprach­mo­del­le Aus­ga­ben in der momen­ta­nen Qua­li­tät lie­fern. Wir hal­ten Spra­che für ein kom­ple­xes Sys­tem und wür­den einer Maschi­ne deren Imi­ta­ti­on zunächst nicht so recht zutrau­en. Aller­dings sind Sprach­mo­del­le nicht ein­fach vom Him­mel gefallen.

Die Grund­la­gen wur­den schon früh gelegt: Sprachassistent:innen wie Siri, Ale­xa, Cort­a­na usw. sind schon län­ger in der Lage gespro­che­ne Spra­che zu erken­nen und Reak­tio­nen auf ein­fa­che Ein­ga­ben zu erzeugen.

In der Infor­ma­tik gilt der Grundsatz:

Wenn du eine Soft­ware oder KI bau­en kannst, die etwas erkennt, kannst du auch eine Soft­ware oder KI bau­en, die das­sel­be Ding imi­tiert.“2

Neben­bei bemerkt wird durch die­sen schlich­ten Satz auch klar, dass jedes Sicher­heits­sys­tem, das auf der Erken­nung von z.B. mensch­li­cher Spra­che oder der Erken­nung von Gesich­tern basiert, kei­ne gute Idee zur Her­stel­lung von Sicher­heit ist – wenn es künst­li­che Intel­li­genz gibt, die mensch­li­che Spra­che und mensch­li­che Gesich­ter imi­tie­ren kann und die­se sich zudem wei­ter entwickelt.

Einen wei­te­ren Ein­blick in die Kom­ple­xi­tät von Sprach­mo­del­len bie­ten übri­gens auch deren Hard­ware­an­for­de­run­gen. Vor kur­zem tauch­te Face­books Sprach­mo­dell „LLaMA“ im Netz auf. Ein hand­li­cher Down­load von 268GB ent­hält unter­schied­li­che Sprach­mo­dell­va­ri­an­ten. In der ein­fachs­ten 7B Vari­an­te benö­tigt LLaMA zwi­schen 12–16GB an VRAM einer Gra­fik­kar­te, mög­lichst vie­le Pro­zes­sor­ker­ne und RAM. Die Ver­ar­bei­tungs­zei­ten selbst ein­fa­cher Prompts auf Stan­dard­hard­ware bewe­gen sich jen­seits erträg­li­cher Wer­te. Damit ist zumin­dest für den Moment klar, dass auf Basis des heu­ti­gen Wis­sens­stan­des nur sehr weni­ge Mark­teil­neh­mer in der Lage sein wer­den, in der Brei­te ver­füg­ba­re Sprach­mo­del­le sta­bil zu betreiben.

Mögliche Auswirkungen auf das kommerzialisierte Internet

Der dazu not­wen­di­ge immense Ener­gie­ver­brauch ist in die­sem Kon­text letzt­lich eine Fuß­no­te, weil Sprach­mo­del­le das Poten­ti­al besit­zen, das Netz in sei­ner Struk­tur fun­da­men­tal zu verändern.

Gera­de das kom­mer­zi­el­le Inter­net besteht aus einer Viel­zahl von Tex­ten, die einen Gebrauchs­cha­rak­ter auf­wei­sen: Nach­rich­ten, Sport­be­rich­te, Pro­dukt­be­schrei­bun­gen und Zusam­men­fas­sun­gen sind durch Sprach­mo­del­le mit rela­tiv begrenz­ten Anwei­sun­gen und Ein­ga­ben auto­ma­ti­siert erstell­bar. Die dazu not­wen­di­gen Daten lie­gen teil­wei­se bereits in digi­ta­li­sier­ter Form vor. Es wird z.B. bei Hand­ball­spie­len ein dezi­dier­tes Spiel­pro­to­koll geführt, aus dem ein heu­ti­ges Sprach­mo­dell mühe­los und weit­ge­hend auto­ma­ti­siert einen Spiel­be­richt erstel­len kann.

Das wird sowohl immense Aus­wir­kun­gen auf jeden Mark­teil­neh­mer haben, der sich mit Con­ten­ter­stel­lung beschäf­tigt, als auch den Such­ma­schi­nen­markt kom­plett ver­än­dern: Der zur Such­an­fra­ge pas­sen­de Inhalt kann theo­re­tisch indi­vi­du­ell gene­riert wer­den – natür­lich auch aus kom­mer­zi­el­len Quel­len. Das wer­den damit span­nen­de Zei­ten für das Leis­tungsschutz­recht: Zitie­ren auch klei­ne­rer Text­pas­sa­gen ist im Prin­zip nicht mehr not­wen­dig. Die Ergeb­nis­se wer­den einer signi­fi­kant gro­ßen Anwender:innengruppe voll­kom­men aus­rei­chen. Die dann ggf. höf­li­cher­wei­se mit ange­ge­be­nen Ori­gi­nal­quel­len erfah­ren kei­ne Auf­merk­sam­keit durch Klicks und Besu­che mehr – einer immens wich­ti­gen ideel­len Wäh­rung im Netz. Damit wer­den ins­be­son­de­re die Inter­net­gi­gan­ten es noch effek­ti­ver bewerk­stel­li­gen, Nutzer:innen in ihrem eige­nen digi­ta­len Öko­sys­tem zu hal­ten. Micro­soft unter­nimmt bereits ers­te Schrit­te mit Bing­AI und der Inte­gra­ti­on von sprach­mo­dell­ba­sier­ter Kor­rek­tur­funk­tio­nen in sei­ne Office­pro­duk­te. Goog­le holt als Reak­ti­on sei­nen auf Lam­da basier­ten Chat­bot „Bard“ wie­der auf die Büh­ne, des­sen Pro­duk­tiv­be­trieb zunächst auf Basis von ethi­schen Beden­ken ver­wor­fen wur­de: Bard konn­te per Sprach­aus­ga­be täu­schend ech­te Anru­fe z.B. zur Reser­vie­rung von Restau­rant­ti­schen oder Essens­be­stel­lun­gen auf Basis von ein­fa­chen Prompts rea­li­sie­ren. Das poten­ti­el­le Miss­brauchs­po­ten­ti­al die­ser Funk­tio­nen stand einer Markt­ein­füh­rung 2021 noch im Weg.

Sprachmodelle als Unterstützung bei Anträgen und Dokumentationen

Deutsch­land hat ein aus­ge­präg­tes Doku­men­ta­ti­ons- und Antrags­we­sen in unter­schied­li­chen Berei­chen eta­bliert: In der Medi­zin z.B. der Arzt­be­richt, in För­der­pro­gram­men umfang­rei­che Anträ­ge, in der Pfle­ge kom­ple­xe Doku­men­ta­tio­nen, Pro­to­kol­le von allen mög­li­chen Sit­zun­gen – die Lis­te lie­ße sich belie­big fort­set­zen. Allen die­sen „Text­gat­tun­gen“ ist gemein, dass sie oft sehr sche­ma­tisch sind – sche­ma­ti­sche Tex­te sind schon heu­te eine Domä­ne von Sprachmodellen.

Sprach­mo­del­le wer­den dabei hel­fen, Men­schen von die­sen sche­ma­ti­schen Auf­ga­ben zu ent­las­ten. Für spe­zi­el­le Fach­be­rei­che sind Text­ge­ne­ra­to­ren denk­bar, die pri­mär mit fach­be­zo­ge­nen Inhal­ten trai­niert wer­den. Dadurch kön­nen sie bei Rou­ti­ne­auf­ga­ben unter­stüt­zen, wenn­gleich nach heu­ti­gem Stand immer noch eine Über­prü­fung der Aus­ga­ben durch einen sach­kun­di­gen Men­schen erfor­der­lich ist.

Aber auch in die­sem Feld ist es kom­pli­ziert. Neh­men wir das Antrags­we­sen in För­der­pro­gram­men: Die teil­wei­se hohen Anfor­de­run­gen an För­der­an­trä­ge die­nen dazu, den Zugriff auf eine begrenz­te Res­sour­ce (z.B. Geld oder Per­so­nal) zu begren­zen. Sprach­mo­del­le wer­den natür­lich dabei hel­fen, bis­her nicht aus­rei­chend genutz­te För­der­mit­tel tat­säch­lich abru­fen zu kön­nen. Es gibt jedoch Res­sour­cen, die völ­lig über­lau­fen sind – etwa die son­der­päd­ago­gi­schen Unter­stüt­zungs­an­ge­bo­te in Schu­len. Auch hier wer­den Sprach­mo­del­le z.B. bei der Erstel­lung von Gut­ach­ten unter­stüt­zen, jedoch blei­ben gera­de per­so­nel­le Res­sour­cen wei­ter­hin knapp. Damit wird der Zugang zu eben­die­sen Res­sour­cen auf ande­ren Wegen erschwert wer­den: Ein gut begrün­de­ter Antrag steht ledig­lich in Kon­kur­renz zu ande­ren sehr gut begrün­de­ten Anträgen.

Sprachmodelle als neutralere Entscheidungsinstanzen?

Sascha Lobo setzt sich in sei­ner Kolum­ne KI kann mensch­li­che Ver­ant­wor­tung nicht erset­zen? – Doch!“ mit der Stel­lung­nah­me des deut­schen Ethik­ra­tes zu künst­li­cher Intel­li­genz aus­ein­an­der. Er for­dert, dass künst­li­che Intel­li­genz in bestimm­ten Berei­chen an die Stel­le der mensch­li­chen Ent­schei­dung tritt – genau da fällt für den deut­schen Ethik­rat die letz­te Gren­ze. Als Bei­spiel kann die Dia­gno­se eines Arz­tes die­nen: Ein spe­zi­ell mit medi­zi­ni­schem Wis­sen trai­nier­tes Sprach­mo­dell könn­te dabei unter­stüt­zen. Als Ein­ga­be die­nen z.B. Labor- und Ana­mne­se­da­ten. Das spe­zia­li­sier­te Sprach­mo­dell könn­te denk­ba­re Erkran­kun­gen auf Basis die­ser Daten ermit­teln und wäre dabei nicht auf das Wis­sen einer Ein­zel­per­son beschränkt.

Für Sascha Lobo ist das ein Fall, bei dem sich die Fra­ge nach dem Ein­satz von Sprach­mo­del­len nicht stellt, son­dern für ihn ver­bind­lich sein soll­te, weil das spe­zia­li­sier­te Sprach­mo­dell dem Men­schen über­le­gen sei. Die­se Argu­men­ta­ti­on erscheint zunächst bestechend – aller­dings ist ein Modell immer nur so gut wie des­sen Ein­ga­be­da­ten, die hier im Rah­men einer Ana­mne­se durch einen Men­schen ent­ste­hen. Das kann bei eini­gen Krank­heits­bil­dern kom­plex und feh­ler­träch­tig sein – gera­de in Zwei­fels­fäl­len: Die glei­che Krank­heit kann bei unter­schied­li­chen Men­schen völ­lig unter­schied­li­che Sym­pto­me aus­lö­sen – es wird eine span­nen­de Fra­ge in wel­chem ggf. lücken­haf­ten Ver­hält­nis das Erfah­rungs­wis­sen eines Men­schen und des­sen Inter­ak­ti­ons­mög­lich­kei­ten mit ande­ren zu der von einer KI gelie­fer­ten Infor­ma­ti­on steht.

Sprachmodelle und Bildungsprozesse

Kom­men wir am Schluss noch ein­mal zurück zu Mar­tha, Han­nes und Fred: Sie wach­sen in einer Welt auf, in der Sprach­mo­del­le mit ihren immer men­schen­ähn­li­che­ren Inter­faces wie ChatGPT in ganz kur­zer Zeit selbst­ver­ständ­lich sein wer­den – gera­de auch in Kom­bi­na­ti­on mit Sprach­ein- und ‑aus­ga­be. Nie wie­der schu­li­sche Übungs­tex­te? Nie wie­der Haus­auf­ga­ben mit künst­li­chen Auf­ga­ben­stel­lun­gen? Sind Haus­auf­ga­ben gar tot? Wenn doch heu­te ein­fa­ches „Promp­ting“ ausreicht?

Ent­schei­dend beim Schrei­ben ist der gedank­li­che Pro­zess bei der Erstel­lung eines Tex­tes. Wenn wir an die Stel­le des Schreib­pro­zes­ses Promp­ting bei einem Sprach­mo­dell set­zen und den Schreib­pro­zess selbst auto­ma­ti­sie­ren, ver­schie­ben wir den Lern­pro­zess auf eine ande­re Ebe­ne. Die­se Ebe­ne erfor­dert letzt­lich gro­ße Beur­tei­lungs­kom­pe­ten­zen, die sich bei Schreib­ler­nen­den wie Mar­tha, Han­nes und Fred noch in einer sen­si­blen Ent­wick­lungs­pha­se befin­den und damit in vie­len Fäl­len eine Über­for­de­rung dar­stel­len müs­sen. Gleich­zei­tig gehen mit eini­ger Wahr­schein­lich­keit schreib­kom­pe­ten­ten Men­schen durch die Nut­zung von Sprach­mo­del­len Trai­nings- und Denk­pro­zes­se bei eigent­li­chen Erstel­len von Tex­ten ver­lo­ren. An deren Stel­le tre­ten Mecha­nis­men zur Ent­wick­lung und Modi­fi­ka­ti­on von geeig­ne­ten Prompts. Genau die­se Vor­ge­hens­wei­sen und Anwen­dun­gen wer­den bereits in gro­ßer Brei­te in den sozia­len Medi­en dis­ku­tiert. War­um den Ein­füh­rungs­text zu Imma­nu­el Kant aus dem Schul­buch lesen? Las­sen wie Schüler:innen doch ein­fach mit einem Chat­Bot „Imma­nu­el Kant“ chat­ten, den eine Lehr­kraft zuvor per „Mega­prompt“ mit Hil­fe eines Sprach­mo­dells erschaf­fen hat und der auf die indi­vi­du­el­len Fra­gen der Schüler:innen eingeht.

Sprach­mo­del­le selbst kön­nen auf­grund ihrer Kom­ple­xi­tät nur von gro­ßen Markt­teil­neh­mern betrie­ben wer­den – das wirft die Fra­ge nach neu­en Abhän­gig­keits­ebe­nen auf, gera­de im Bildungssystem.

Chancen und neue Herausforderungen

Sprach­mo­del­le berüh­ren einen Bereich, der eine Gesell­schaft aus­macht: Die Kom­mu­ni­ka­ti­on und den Umgang mit Spra­che. Sie sind nach Maß­stä­ben der Digi­ta­li­sie­rung nichts wirk­lich Neu­es, wie Goo­gles Chat­Bot „Bard“ bereits vor drei Jah­ren zeig­te. Mit ChatGPT steht erst­mals ein Inter­face zum Sprach­mo­dell GPT zur Ver­fü­gung, was durch vie­le Men­schen nie­der­schwel­lig nutz­bar ist. Vie­le Anfor­de­run­gen wer­den noch nicht zufrie­den­stel­lend gelöst. Jedoch kön­nen Sprach­mo­del­le auf Mil­lio­nen von Nutzer:inneneingaben zurück­grei­fen und auf deren Basis wei­ter­ent­wi­ckelt wer­den. Bereits auf dem Stand der heu­ti­gen Ent­wick­lung ist immenses Poten­ti­al auf unter­schied­li­chen Ebe­nen erahn­bar. Gleich­zei­tig tre­ten ganz neue Fra­ge­stel­lun­gen auf, die vor allem Juris­ten und Ethi­ker beschäf­ti­gen wer­den. Die Kom­ple­xi­tät bei der Modi­fi­ka­ti­on und dem Betrieb von Sprach­mo­del­len wird dafür sor­gen, dass sie pri­mär in der Hand der Inter­net­gi­gan­ten blei­ben wer­den. Was die­se ohne wirk­sa­me staat­li­che Regu­lie­rung dar­aus machen wer­den, bleibt eine offe­ne Frage.

1 Geth­mann, Bux­mann Dis­tel­rath, Humm, Ling­ner, Nit­sch, Schmidt, Spiecker genannt Döh­mann: „Künst­li­che Intel­li­genz in der For­schung – Neue Mög­lich­kei­ten und Her­aus­for­de­run­gen für die Wis­sen­schaft“, S. 10, aus der Rei­he: Ethics of Sci­ence and Tech­no­lo­gy Assess­ment Bd. 48, bei: Springer

Die SWK möchte als kurzfristige Lösung Mehrarbeit, Abbau von Teilzeit und größere Klassen

Die politisch geschickt instrumentalisierte SWK

Manch­mal bin ja Pro­phet: Ich habe vie­le die­ser Vor­schlä­ge bereits vor eini­ger Zeit vor­aus­ge­se­hen: Lehr­kräf­te gewin­nen & Lehr­kräf­te­man­gel über­win­den – als Laie. Die SWK bekommt in sozia­len Medi­en gera­de doch recht ein­deu­ti­ge Reak­tio­nen, die Tei­le ihrer Mit­glie­der offen­bar stark ver­un­si­chert. Renom­mier­te Bildungsjournalist:innen wie der von mir geschätz­te Jan-Mar­tin Wiar­da sprin­gen ihr bei. Zwi­schen­tö­ne wie der Ver­such, Unter­richts­qua­li­tät durch Ein­satz aus­ge­bil­de­ter Lehr­kräf­te erhal­ten zu wol­len, ver­hal­len gegen­über den Maß­nah­men aus dem „Gift­schrank“.

Es war aus mei­ner Sicht kei­ne klu­ge Ent­schei­dung der SWK, den vor­an­ge­gan­ge­nen Auf­trag der KMK über­haupt anzu­neh­men – offen­bar ohne ihn zu modi­fi­zie­ren. Es ist sehr span­nend, wor­über öffent­lich gespro­chen wird. Span­nend ist aber auch, wor­über in Zusam­men­hang mit der SWK-Ver­öf­fent­li­chung nicht gespro­chen wird und wer sich gera­de nicht öffent­lich äußert und erklärt.

Ver­misst habe ich z.B. eine belast­ba­re Erhe­bung über die Grün­de, war­um Lehr­kräf­te in Teil­zeit gehen. Ver­bän­de und Lehr­kräf­te selbst behaup­ten: Wegen Über­las­tung und dem Wunsch, den Beruf mög­lichst gut und schü­ler­ge­recht zu machen. Ande­re gesell­schaft­li­che Grup­pen behaup­ten: Wegen Bequem­lich­keit und dabei zu aus­kömm­li­cher Besol­dung. Mir feh­len dazu Zah­len. Daten­ge­stütz­te Erkennt­nis­se dazu könn­ten nicht uner­heb­lich zu geeig­ne­ten Maß­nah­men bei­tra­gen. Belast­ba­re Zah­len wird man in die­ser Pha­se der Debat­te nicht mehr bekommen.

Ver­misst habe ich übri­gens wei­ter­hin die Idee, mit ande­ren Auf­ga­ben betrau­te Lehr­kräf­te zurück ins Sys­tem zu holen, z.B. Fach­be­ra­tung, Medi­en­be­ra­tung, Schul­ent­wick­lungs­be­ra­tung, Schul­in­spek­ti­on bzw. all­ge­mein Men­schen mit Lehr­amts­aus­bil­dung, die an Schul­be­hör­den, Lan­des­in­sti­tu­ten und Minis­te­ri­en arbei­ten – da wäre noch eini­ges zu holen, um den Preis einer wei­te­ren sys­te­ma­ti­schen Schwä­chung des Mit­tel­baus des Schul­sys­tems, die schon seit Jah­ren u.a. von exter­nen Bera­tungs­agen­tu­ren vor­an­ge­trie­ben wird.

Poli­tik instru­men­ta­li­siert nun­mal ger­ne – das Feu­er rich­tet sich zur­zeit recht effek­tiv gegen die Wissenschaftler:innen. Dabei hät­te ich ganz ande­re Fra­gen – z.B. ob die alt­ehr­wür­di­ge KMK (immer­hin selbst län­ger exis­tie­rend als der Bun­des­rat) eine geeig­ne­te Struk­tur dar­stellt und dar­ge­stellt hat, unser Bil­dung­s­ys­tem in eine Rich­tung zu ent­wi­ckeln, die der Volks­wirt­schaft und Kul­tur eines boden­schatz­ar­men Lan­des gerecht wer­den könn­te. Immer­hin spricht die SWK ja selbst von Pro­ble­men von his­to­ri­schem Aus­maß – da darf es fol­ge­rich­tig auch kei­ne Denk­ver­bo­te hin­sicht­lich des Fort­be­stands von Struk­tu­ren jed­we­der Art und Geschich­te geben.

Fehlende Alternativen zu den Vorschlägen der SWK

Ich mache mich jetzt ein­mal unbe­liebt: Es gibt objek­tiv m.E. über­haupt kei­ne Alter­na­ti­ve zu den vor­ge­schla­ge­nen Maß­nah­men, wenn man die bis­he­ri­ge – schon jetzt oft kri­ti­sier­te – Unter­richts­qua­li- und ‑quan­ti­tät zumin­dest für einen gewis­sen, wahr­schein­lich recht kur­zen Zeit­raum auf­recht erhal­ten möchte.

Daher lau­fen dra­ma­ti­sie­ren­de Kom­men­ta­re wie der von Bob Blu­me im Spie­gel weit­ge­hend ins Lee­re: Sie benen­nen Misstän­de und Fehl­ar­gu­men­ta­tio­nen – sie blei­ben jedoch letzt­lich die Ant­wort schul­dig, was man denn jetzt genau für die Schüler:innen machen soll, die sich im Sys­tem befin­den. Über­wie­gen­de Tei­le der Gesell­schaft sind der Kla­ge der Lehr­kräf­te wahr­schein­lich überdrüssig.

Die Maß­nah­men selbst wer­den zwar kurz­fris­tig hel­fen, aber letzt­lich dazu füh­ren, dass sich Fehl­ent­wick­lun­gen wei­ter ver­schär­fen. Die Zeit, um gegen­zu­steu­ern, wird nicht aus­rei­chen. Der Ver­weis auf Ver­säum­nis­se in der Ver­gan­gen­heit mag eben­falls objek­tiv rich­tig, aber noch weni­ger hilf­reich bei der Bewäl­ti­gung aktu­el­ler Her­aus­for­de­run­gen sein.

Warum die Idee einer Imagesteigerung des Lehrer:innenberufes bestenfalls niedlich ist

Wer for­dert, das Image des Lehrer:innenberufs zu ver­bes­sern, um mehr Bewerber:innen gewin­nen zu kön­nen und z.B. mehr Stu­di­en­plät­ze schaf­fen möch­te, ver­kennt die Situa­ti­on in der Gesamt­ge­sell­schaft: Das Fach­kräf­te­pro­blem ist ein gesamt­ge­sell­schaft­li­ches! Das Hand­werk, die öffent­li­che Ver­wal­tung, die Bun­des­wehr, die Poli­zei, das Gesund­heits­sys­tem, die früh­kind­li­che Bil­dung, die Indus­trie – eigent­lich nahe­zu alle Bran­chen tre­ten zu der oft vor­ge­schla­ge­nen „Image­of­fen­si­ve“ in Kon­kur­renz. Es feh­len schlicht die Men­schen für die Auf­ga­ben inner­halb von Wirt­schaft und Ver­wal­tung. Als leid­lich gut aus­ge­bil­de­ter jun­ger Mensch bin ich nicht (mehr) dar­auf ange­wie­sen, um die Gunst eines Sys­tems zu buh­len – es bewer­ben sich gleich meh­re­re um mich. Je grö­ßer dabei die Not, des­to gerin­ger muss übri­gens fol­ge­rich­tig zusätz­lich im Prin­zip die eige­ne Kom­pe­tenz von Bewerber:innen sein. Ggf. könn­te die oft beschwo­re­ne „Deindus­tria­li­sie­rung Deutsch­lands“ gera­de nicht durch Steu­ern und Ener­gie­prei­se, son­dern letz­ten­en­des durch das schlich­te Feh­len von Köp­fen vor­an­ge­trie­ben wer­den, wenn Fak­to­ren wie poli­ti­sche Sta­bi­li­tät und frei­heit­li­che Gesell­schafts­ver­hält­nis­se kein aus­rei­chen­des Wachs­tum in einer kapi­ta­lis­ti­schen Markt­lo­gik der Groß­kon­zer­ne mehr garantieren.

Was also tun?

Eine Attrak­ti­vi­täts­stei­ge­rung mit Strahl­kraft kann nur aus dem Sys­tem her­aus erfol­gen. Poli­tisch muss alles dar­an gesetzt wer­den, enga­gier­te und klu­ge Köp­fe im Bil­dung­s­ys­tem um jeden Preis zu hal­ten. Das geht mit den bis­he­ri­gen Ver­wal­tungs- und Hörig­keits­struk­tu­ren nicht. Wenn sich Ver­ant­wort­li­che immer wie­der auf ihr Recht beru­fen könn­ten, z.B. Wei­sun­gen zu ertei­len, die dann prak­tisch nicht umsetz­bar sind, wird es schwie­rig. Wenn wir gegen­über Lehr­kräf­ten immer wie­der Kon­zep­te des maxi­ma­len Miss­trau­ens fah­ren (z.B. enge Vor­schrif­ten zur jus­ti­tia­blen Kor­rek­tur oder Durch­füh­rung von Prü­fun­gen), wird es schwie­rig. Wie wäre es statt­des­sen mit einer umfas­sen­den Rechts­schutz­ver­si­che­rung? Oder umfas­sen­den Insas­sen­ver­si­che­rung, wenn der enga­gier­te Kol­le­ge mit der klei­nen Schüler:innengruppe zu einem Wett­be­werb fährt anstatt dann auch noch einen Antrag stel­len zu müs­sen? Ver­trau­en statt Miss­trau­en als default, dienst­recht­li­che Maß­nah­men – dann bit­te auch ger­ne wirk­lich eska­lie­rend – bei fort­ge­setz­tem Fehlverhalten.

Was wei­ter­hin kom­plett fehlt, ist eine Per­spek­ti­ve für die Men­schen, die sich jetzt im Sys­tem befin­den. Die Erfah­rung aus der Ver­gan­gen­heit ist, das Mehr­be­las­tun­gen schnell umge­setzt, Ent­las­tun­gen dann aber immer wie­der ver­tagt wer­den. Solan­ge die­ser Zyklus nicht durch eine ech­te Per­spek­ti­ve durch­bro­chen wird, bleibt es schwie­rig. Sym­bo­le wie die Abset­zung der KMK wür­den zwar m.E. immens hel­fen, sind wahr­schein­lich for­mal nicht rea­lis­tisch. Und so kon­struk­tiv ist die­se For­de­rung ja auch wie­der nicht. Zu den Anfän­gen die­ses Blogs hat­te ich ein­mal die Idee, dass Bil­dungs­sys­tem einer staat­lich eng kon­trol­lier­ten NGO anzu­ver­trau­en. Ja, ich weiß, Föde­ra­lis­mus und so. Aber es wür­de zumin­dest das Bil­dung­s­ys­tems den Legis­la­tur­pe­ri­oden ent­zie­hen – ich ernied­ri­ge daher auf:  „Der KMK eine NGO ent­ge­gen­stel­len“ (und nach zehn Jah­re zu schau­en, woher die nach­hal­ti­gie­ren Impul­se gekom­men sind – die ande­re Orga­ni­sa­ti­on wird dann auf­ge­löst.) Das wären viel­leicht ein Sym­bol und eine geeig­ne­te Perspektive.

Zivilgesellschaft muss es noch mehr als jetzt schon richten

Jetzt kommt schon wie­der etwas Unan­ge­neh­mes: Trotz­dem Poli­tik und Ver­wal­tung viel zur aktu­el­len Kri­se bei­getra­gen haben, wer­den es Poli­tik und Ver­wal­tung nicht ohne Lehr­kräf­te und Zivil­ge­sell­schaft schaf­fen. Wir Lehr­kräf­te mit gro­ßen oder kei­nen Kin­dern müs­sen weg von der Hal­tung: „Jetzt sol­len die Jun­gen mal!“ (falls wir sie hät­ten, soll ja schon vor­ge­kom­men sein). Spe­zi­ell auf uns kommt eini­ges zu. Gleich­zei­tig müs­sen wir uns mehr unse­res Wer­tes für das Sys­tem bewusst wer­den und das dann so leben. Wir haben eine Loya­li­täts­pflicht gegen­über dem Dienst­her­ren, er aber auch eine gegen­über uns. Das wird ger­ne ver­ges­sen. Wider­stands­for­men hin­ter der eige­nen Klas­sen­raum­tür inter­es­sie­ren eine for­ma­le Struk­tur wir eine Schul­bü­ro­kra­tie wesent­lich weni­ger als Wider­stands­for­men, die Ver­wal­tungs­ak­te aus­lö­sen und z.B. mit Hil­fe von Ver­bän­den ihrer­seits intern und immer der Treue­pflicht fol­gend eska­liert wer­den können.

Um es kon­kre­ter zu machen: Beam­te müs­sen beam­ten­recht­lich amts­an­ge­mes­sen beschäf­tigt wer­den. Das ist ein ziem­lich rele­van­ter Kern der Für­sor­ge­pflicht. Die ihnen über­tra­ge­nen Auf­ga­ben müs­sen ihren Qua­li­fi­ka­tio­nen (Hebel­punkt 1) und der Wer­tig­keit ihres Amtes (Hebel­punkt 2) ent­spre­chen. Die Aus­ge­stal­tung eines Amtes durch den Dienst­herrn hat hier eine juris­ti­sche Grenze.

Wir – und damit mei­ne ich vie­le Män­ner – dür­fen die Haupt­last der fami­liä­ren Auf­ga­ben nicht vor­wie­gend Frau­en auf­bür­den. Alle Män­ner, die die Kon­fek­ti­ons­grö­ßen ihrer Kin­der nicht ken­nen, tun das. Also auch ich. Vie­le Frau­en sind im Sys­tem wegen der fami­li­en­freund­li­chen Anpas­sungs­mög­lich­kei­ten der Arbeits­zeit und tra­gen aber gleich­zei­tig die vol­le Last des „Fami­li­en­ma­nage­ments“, d.h. Lebens­mo­del­le von Lehr­erfa­mi­li­en wer­den durch Reduk­ti­on der Teil­zeit­mög­lich­kei­ten nicht unbe­rührt blei­ben kön­nen. Ich bin mir näm­lich nicht so sicher, ob es wirk­lich vie­le Lehr­kräf­te gibt, die ohne eige­ne Kin­der unter 18 Jah­ren oder pfle­ge­be­dütf­ti­ge Ange­hö­ri­ge Stun­den redu­zie­ren. Die Ermitt­lung kon­kre­ter Zah­len dazu ist die SWK schul­dig geblie­ben. 49% Teil­zeit­quo­te hört sich erst­mal viel an, ja.

Vertrauen muss wieder default werden

Eltern müs­sen in Erzie­hungs­fra­gen noch mehr als jetzt in Ver­ant­wor­tung gehen. Koope­ra­ti­on soll­te Kon­fron­ta­ti­on ste­chen, auch wenn Erzieher:innen und Lehr­kräf­te die indi­vi­du­el­len Bedürf­nis­se der eige­nen Kin­der zuneh­mend eher weni­ger als mehr erfül­len kön­nen. Sonst wird es bald deut­lich weni­ger Men­schen geben, die dazu bereit und auch noch in der Lage sind, indi­vi­du­ell auf Kin­der ein­zu­ge­hen. Ich möch­te allen Eltern Mut machen, den Lehr­kräf­ten ihrer Kin­der zu ver­trau­en. Wenn die­ses Ver­trau­en gestört ist, gibt es taug­li­che Mit­tel (Gesprächs­ter­min + ggf. dann wei­te­re Eska­la­ti­on) und weni­ger taug­li­che Mit­tel (Ver­öf­fent­li­chung von Kor­rek­tu­ren auf Social­me­dia, Beschwer­de bei der Schul­be­hör­de als ers­te Reak­ti­on) zur Lösungsanbahnung.

Ich möch­te den Schul­be­hör­den und Kul­tus­mi­nis­te­ri­en Mut machen, ihren Schul­lei­tun­gen und Lehr­kräf­ten mehr oder anders zu ver­trau­en. Ziel muss Selbst­stän­dig­keit sein. Nur das trägt lang­fris­tig zur Arbeits­ent­las­tung von Schul­lei­tun­gen und Behör­den bei. Kon­trol­le und Bera­tung mit dem Ziel der unbe­ding­ten Pflicht­er­fül­lung wird immer ver­un­si­chern. Ver­un­si­che­rung zieht ein Bestre­ben nach Absi­che­rung nach sich. Vie­le klein­tei­li­ge Nach­fra­gen von vie­len Kolleg:innen kann z.B. kei­ne Schul­lei­tung die­ser Welt bewältigen.

Wenn etwas Öffent­lich­keits­wirk­sa­mes schu­li­sches Per­so­nal angeht, darf man schu­li­schem Per­so­nal ver­trau­en und es VOR der Öffent­lich­keit infor­mie­ren. Neue­run­gen und Auf­trä­ge z.B. aus Pres­se­mit­tei­lun­gen zu erfah­ren stärkt an der Basis nicht die Auto­ri­tät über­ge­ord­ne­ter Behör­den. Das ist schlicht opti­mier­ba­rer Füh­rungs­stil. Ide­al wäre natür­lich eine Betei­li­gung der Basis an Ent­schei­dungs­pro­zes­sen, aber natür­lich wenig realistisch.

Wo Men­schen arbei­ten, gesche­hen Feh­ler. Wo Men­schen über­las­tet sind, über­pro­por­tio­nal vie­le. Man kann jetzt so tun, als bestün­de die Mög­lich­keit, dass der­ar­ti­ge Feh­ler im Prin­zip immer wie­der und über­all vor­kom­men – obwohl sie sta­tis­tisch kaum rele­vant sind – und für alle mög­li­chen Spe­zi­al­fäl­le, die sel­ten ein­tre­ten, neue Vor­ga­ben, Erlas­se und Ver­ord­nun­gen gene­rie­ren, die letzt­lich die Arbeit aller ein­schrän­ken und erschwe­ren – das kann sogar dazu füh­ren, dass die Behör­de bei Anfra­gen dann selbst nicht mehr durch­blickt und letzt­lich auch mehr Arbeit hat.

Man kann aber auch dar­auf ver­trau­en, dass im Schul­sys­tem in der Mehr­zahl gut aus­ge­bil­de­te Men­schen arbei­ten, die die Res­sour­cen des Dienst­herrn nicht absicht­lich oder fahr­läs­sig bin­den wol­len. Und die Welt ist gemein: Es tre­ten immer wie­der Fäl­le ein, die unvor­her­seh­bar waren. Und dann reagiert man wie­der mit neu­en Vor­ga­ben, Erlas­sen und Ver­ord­nun­gen, die Arbeit aller erschwe­ren? Viel­leicht ist die­ses Kon­zept selbst bedingt zielführend.

Men­schen arbei­ten ger­ne in Umge­bun­gen, die ihnen etwas zutraut und die ihnen selbst ver­traut. Und das Schul­sys­tem muss attrak­ti­ver wer­den. Ver­trau­en als default bit­te! (klappt bei Professor:innen und Richter:innen im Wesent­li­chen auch).

Reform der Ausbildung von Erzieher:innen und Lehrkräften

Eines vor­weg und wie­der umpo­pu­lär: Für die Sekun­dar­stu­fe habe ich kei­ne Lösung. Die scheint aber auch nicht so wich­tig zu sein wie der Ele­men­tar- und Prim­ar­be­reich, wenn Din­ge wie Chan­cen­gleich­heit und Anhe­bung des gesam­ten Bil­dungs­ni­veaus einer Bevöl­ke­rung im Mit­tel­punkt ste­hen – da ver­lie­ren wir die Kin­der wesent­lich frü­her und das lässt sich auch kaum wie­der auf­ho­len, wenn ich die mir bekann­ten Stu­di­en rich­tig gele­sen habe. Daher: Im KiTa- und Krip­pen­be­reich müs­sen wir die Aus­bil­dungs­qua­li­tät anhe­ben. Das soll­ten zumin­dest ver­mehrt aka­de­mi­sche Berufs­bil­der sein.

Im Prim­ar­be­reich ist mir das Kon­zept eines dua­len Stu­di­ums sehr sym­pa­thisch. Koope­ra­ti­on mit ande­ren Fach­kräf­ten kommt im Prim­ar­be­reich im Berufs­all­tag deut­lich öfter vor als in höhe­ren Schul­for­men. Das bil­det eine gute Grund­la­ge für jun­ge Men­schen, die sich beruf­lich noch fin­den wol­len und eine frü­he Per­spek­ti­ve auf das, was Schu­le aus­macht. Und ein frü­her Ein­blick bie­tet Chan­cen, sich zu begeis­tern und auch fach­lich im Stu­di­um Leis­tung zu brin­gen, aber auch frü­he Chan­cen auf Umori­en­tie­rung. So könn­ten Schu­len von mehr klu­gen Köp­fen im All­tag profitieren.

Die größ­te Ent­las­tung für wei­ter­füh­ren­de Schul­for­men wären m.E. letzt­lich Men­schen, die in der Mehr­zahl lern­of­fen und selbst­kom­pe­tent sind. Gleich­zei­tig könn­te das das Arbeits­um­feld attrak­tiv machen, wenn jun­ge Men­schen uns dann anders fordern.

Fachkräfte zur Entlastung der Lehrkräfte von fachfremden Aufgaben?

Die fach­frem­den Auf­ga­ben gibt es ja an Schu­len for­mal nicht, weil für die Aus­ge­stal­tung des Lehr­kräf­te­be­ru­fes der Grund­satz der Amts­an­ge­mes­sen­heit gilt (s.o.). Die Vor­schlä­ge der SWK zur Ent­las­tung von Lehr­kräf­ten in die­sem Bereich blei­ben mir ver­gli­chen mit den sehr kon­kre­ten Berech­nun­gen zu Stun­den­ge­win­nen durch Ein­schrän­kung von Teil­zeit­op­tio­nen, Mehr­ar­beit und Co. etwas zu vage. Die Idee einer Kor­rek­turas­sis­tenz ist ja wahr­schein­lich auf den ers­ten Blick ganz nett, aber ver­kennt, dass hier vie­le Fra­gen offen­blei­ben – etwa die nach der Qua­li­fi­zie­rung der betei­lig­ten Per­so­nen und dem Auf­wand für die not­wen­di­gen Kommunikationsprozesse.

Die Digi­ta­li­sie­rung wird nach mei­nem Emp­fin­den von der SWK noch zu stark mit tech­ni­schem Fokus gedacht anstatt deren gesamt­ge­sell­schaft­li­che Impli­ka­tio­nen in den Blick zu neh­men. Die Vor­schlä­ge zum Hybrid­un­ter­richt erschei­nen mit sehr stark durch klas­si­sche uni­ver­si­tä­re Lern­set­tings geprägt. Wie könn­ten Stel­len­be­schrei­bun­gen für Per­so­nal kon­kret aus­se­hen, das Lehr­kräf­te nach­hal­tig ent­las­ten soll? Wo wer­den die ein­zu­set­zen­den Res­sour­cen erho­ben und eben­so pla­ka­tiv berech­net und mit Zah­len hin­ter­legt wie die zu erwar­te­ten­den Stun­den­ge­win­ne? (war wahr­schein­lich nicht der „Auf­trag“).

Und das Digitale?

Ach, ich glau­be mei­ne Gedan­ken dazu ver­kau­fe ich bes­ser wie­der in Form eines kom­mer­zi­el­len Arti­kels :o)…

 

 

 

 

 

 

ChatGPT und Co. – der Versuch eines Blickes unter die Haube

Wenn man in sozia­len Netz­wer­ken über Sprach­mo­del­le wie GPT‑3 liest, blei­ben genau wie in den Feuil­le­tons die meis­ten Ana­ly­sen und Bewer­tun­gen auf der phä­no­me­no­lo­gi­schen Ebe­ne stehen:

  • Was kann ich im Unter­richt damit machen?
  • Was muss ich tun, damit ein Feh­ler in der Aus­ga­be auftritt?
  • Wel­chen Ein­fluss wer­den Sprach­mo­del­le auf die Schu­le der Zukunft haben?
  • War­um soll­ten Sprach­mo­del­le in der Schu­le nicht ver­bo­ten werden?
  • […]

Eine Analogie

Wenn ich mit Schul­klas­sen das ers­te Mal mit Indi­ka­to­ren im Che­mie­un­ter­richt expe­ri­men­tie­re, kommt es für vie­le zunächst nicht dar­auf an, war­um ein Indi­ka­tor eine bestimm­te Far­be hat, son­dern eher dar­auf, wie sich mög­lichst vie­le unter­schied­li­che Far­ben durch wahl­lo­ses Zusam­men­kip­pen erzeu­gen las­sen. Ich könn­te dabei in Aner­ken­nung der indi­vi­du­el­len Neu­gier Fra­gen stel­len, die auf einem ähn­li­chen phä­no­me­no­lo­gi­schen Level wie die sozia­len Medi­en zur Sprach­mo­del­len dis­ku­tier­ten Fra­gen operieren.

  • Durch wel­chen Men­gen­ver­hält­nis­se bekom­me ich wel­che Far­be hin?
  • Wie kann ich die­se Far­ben außer­halb des Labors nutzen?
  • Wel­chen Ein­fluss hat das neue Farb­spek­trum auf die Ent­wick­lung neu­er Wandfarben?
  • Stellt die­se Neu­ent­wick­lung nicht grund­le­gen­de Ver­fah­ren der Farb­her­stel­lung und des ästhe­ti­schen Emp­fin­dens in Frage?

Die­se Fra­gen sind berech­tigt. Aber eigent­lich sind die Indi­ka­to­ren z.B. ein Mit­tel, um sich gene­rel­len Stoff­ei­gen­schaf­ten (sau­er / alka­lisch) auf einer phä­no­me­no­lo­gi­schen Ebe­ne anzu­nä­hern, Gesetz­mä­ßig­kei­ten zu ent­de­cken und dar­aus wei­te­re all­ge­mei­ne Aus­sa­gen abzu­lei­ten. Nie­mand käme hier auf die (didak­ti­sche) Idee, hier auf der Ebe­ne der Phä­no­me­ne ste­hen­zu­blei­ben oder Men­schen auf Basis der blo­ßen Beob­ach­tung die­ser Phä­no­me­ne etwas „ver­mit­teln“ zu wollen.

Was ich selbst über Sprachmodelle weiß

Sprach­mo­del­le erle­be ich zur­zeit selbst auf einer phä­no­me­no­lo­gi­schen Ebe­ne. Ich expe­ri­men­tie­re mit Ein­ga­ben und unter­schied­li­chen Para­me­tern her­um. Ich weiß den­noch eini­ges über IT-Sys­te­me, was mir ein wenig hilft, die Leis­tun­gen von Sprach­mo­del­len ein­zu­ord­nen. Ich möch­te für mich durch die­sen Text eher ein­gren­zen, was ich eigent­lich noch nicht weiß, um dar­aus dann Fra­gen zu ent­wi­ckeln, die etwas weg von den Phä­no­me­nen füh­ren. Ich nut­ze dazu Kennt­nis­se, die ich im Rah­men mei­nes Infor­ma­tik­stu­di­ums auf Lehr­amt anders hineinvernetzte.

Ein Sprachmodell braucht eine Grammatik

Eine sehr simp­le Metho­de zur Beschrei­bung einer Gram­ma­tik ist die Erwei­ter­te Backus-Naur-Form (ENBF). Selbst die genaue gram­ma­ti­sche Defi­ni­ti­on einer Zahl ist schon gar nicht so einfach.

Ken­nen“ muss ein Mensch oder IT-Sys­tem dazu zunächst die in einer Spra­che ver­wen­de­ten Sym­bo­le (Ter­mi­na­le), wir ver­wen­den in Deutsch­land die Zei­chen 0–9 zur Dar­stel­lung von Zah­len, das sind also unse­re Terminale.

ZifferAusserNull = "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9";
Ziffer           = "0" | ZifferAusserNull

Damit haben wir defi­niert, wel­che Sym­bo­le unse­re Spra­che zur Dar­stel­lung von Zah­len ver­wen­det. Das „|“-Zei­chen ist als „oder“ zu lesen. Die­se Defi­ni­tio­nen kön­nen wir für alle wei­te­ren als Platz­hal­ter ver­wen­den. Damit kön­nen wir jetzt eine natür­li­che Zahl definieren:

NatuerlicheZahl   = ZifferAusserNull, { Ziffer };
NegativeGanzeZahl = "-", NatuerlicheZahl;

Der Aus­druck in geschweif­ten Klam­mern kann belie­big oft oder gar nicht vor­kom­men. Jetzt kann unse­re „KI“ auf Basis die­ser Gram­ma­tik gan­ze Zah­len mit Vor­zei­chen, aber kei­ne Null erkennen.

Das geht aber mit die­ser Definition:

Zahl = ([ "-" ], ZifferAusserNull, { Ziffer }) | "0" ;

Eine Zahl besteht aus einem optio­na­len Minus­zei­chen, gefolgt von einer Zif­fer außer Null, gefolgt von belie­big vie­len wei­te­ren Zif­fern (auch kei­ner wei­te­ren Zif­fer). Oder: Eine Zahl besteht aus dem Zei­chen Null.

Bei Wor­ten wird es schon schwieriger.

Wort = [A-Z], {a-z}

Ein Wort besteht aus min­des­tens zwei Sym­bo­len aus dem Zei­chen­vor­rat a‑z, wobei am Anfang auch der Sym­bol­vor­rat {A‑Z} ste­hen kann.

Dum­mer­wei­se erfüllt jedes Fan­ta­sie­wort belie­bi­ger Län­ge genau die­se Bedin­gung. An eine Defi­ni­ti­on von „Satz“ mag ich da gar nicht erst den­ken. Aber jedes Sprach­mo­dell muss in einem ers­ten Schritt die Ein­ga­be auf Basis von vor­ge­be­nen Regeln ana­ly­sie­ren, bevor es intern wei­ter­ar­bei­ten kann.

Es wird aber auch schon jetzt klar, dass nicht gram­ma­tik­kon­for­me Eingaben

  1. erkannt
  2. auf Feh­ler ana­ly­siert sind

Damit kön­nen ins­be­son­de­re Recht­schreib­feh­ler recht ein­fach kor­ri­giert wer­den, indem auf Basis von z.B. Wahr­schein­lich­kei­ten ein gram­ma­ti­kon­for­mer Ersatz gesucht wird.

Ein Sprachmodell braucht eine Semantik

Bei uns im Hand­ball wird eine Soft­ware für Spiel­pro­to­kol­le ein­ge­setzt. Die Ein­ga­ben macht ein spe­zi­ell geschul­ter Mensch (z.B. ich), der „Sekre­tär“ genannt wird. Ein sol­ches Spiel­pro­to­koll sieht tech­nisch etwa so aus:

00:59   TOR     HEIM   01   1:0
01:02   GELB    GAST   89
08:36   ZEIT    GAST   89
08:45   TOR 7M  HEIM   04   2:0

Das ers­te Tor fiel für die Heim­mann­schaft nach 59s nach einem Foul des geg­ne­ri­schen Spie­lers mit der Num­mer 89. Es dau­er­te lan­ge 7:34 Minu­ten, bis der nächs­te Tref­fer per 7m nach einem mit Zeit­stra­fe geahn­de­tem Foul dem Spie­ler mit der Num­mer 4 gelang.“

Mit dem Kon­text „Hand­ball­spiel“ kann eigent­lich auch jeder, der in der Hal­le nicht anwe­send war, auf die­ser Basis einen kor­rek­ten Spiel­be­richt ver­fas­sen. Aus Meta­da­ten wie der Zeit las­sen sich auf Basis von Wahr­schein­lich­kei­ten wei­te­re Aus­sa­gen ergän­zen, z.B. sind tor­lo­se sie­ben Minu­ten im Hand­ball schon recht unge­wöhn­lich und es kom­men dafür nur weni­ge Ursa­chen in Betracht. Die Text­sor­te „Bericht“ gibt gram­ma­tisch die zu ver­wen­den­de Zeit­form vor, die mög­li­chen Ver­ben in einem Sport­be­richt sind zudem begrenzt.

Ich glau­be, dass man sich gut vor­stel­len kann, wie sich das Ver­fas­sen von Spiel­be­rich­ten ver­gleichs­wei­se ein­fach mit einem IT-Sys­tem umset­zen lässt, wenn es Regeln zur Umset­zung der Daten in eine Gram­ma­tik gibt. Der resul­tie­ren­de Text wirkt erst ein­mal authen­tisch, wenn er unse­re Erwar­tun­gen an einen Sport­be­richt erfüllt. Das tut er wie­der­um, wenn bestimm­te For­mu­lie­run­gen und Wort­grup­pen ent­hal­ten sind.

Ein Sprachmodell braucht Varianz

Mit einer Gram­ma­tik, ein per Daten und Kon­text las­sen sich schon Tex­te schrei­ben, aber nach ein paar Wochen im Sport­teil wür­de uns dann doch die Lust beim Lesen ver­ge­hen. Ähn­li­che Ein­ga­ben wür­den immer wie­der glei­che For­mu­lie­run­gen her­vor­brin­gen. Als „krea­tiv“ emp­fän­den wir Tex­te, die immer wie­der neue For­mu­lie­rungs­ideen ent­hal­ten wür­den. Die­se könn­te man auch hän­disch in unser bis­he­ri­ges Sprach­mo­dell kip­pen, aber schö­ner wäre es ja schon, wenn das auch auto­ma­ti­siert gin­ge. Und da kom­men neu­ro­na­le Net­ze ins Spiel. Die Funk­ti­ons­wei­se lässt sich am bes­ten mit einer star­ken Ver­ein­fa­chung erklären.

Dazu eine Geschich­te: Es gab eine Zeit, in der in Super­märk­ten Waa­gen zum Selbst­wie­gen stan­den. Da muss­te man eine Tas­te mit z.B. einem Sym­bol  oder einer Num­mer für die auf­ge­leg­te Ware drü­cken und es kam ein Bon zum Auf­kle­ben für die Kas­se her­aus. Es gab auch schon ers­te Waa­gen, die das auf­ge­leg­te Obst oder Gemü­se bereits optisch erken­nen konn­ten, aber trotz­dem noch Tas­ten hat­ten, die auch gedrückt wer­den mussten.

Das IT-Sys­tem hät­te dabei z.B. aus die­sen Kom­po­nen­ten bestehen können:

Eine Ein­ga­be­schicht:

  • Eine Kame­ra, die ein hoch­auf­lö­sen­des Bild von der auf­ge­leg­ten Ware macht.
  • Ein Gewichts­sen­sor, der das Gewicht digi­tal ermittelt.
  • Eine Tas­te, die die Kun­den­ein­ga­be weiterleitet.

Eine Ver­ar­bei­tungs­schicht:

  • Ein Algo­rith­mus, der aus dem Bild die Län­ge der auf­ge­leg­ten Ware ermit­telt („Neu­ron 1“).
  • Ein Algo­rith­mus, der aus dem Bild die Brei­te der auf­ge­leg­ten Ware ermit­telt („Neu­ron 2“).
  • Ein Algo­rith­mus, der die Bild­punk­te der domi­nie­ren­den Far­be der Ware zählt („Neu­ron 3“).
  • Ein Algo­rith­mus, der das Gewicht ins Ver­hält­nis zur Grö­ße setzt („Neu­ron 4“).
  • Ein Algo­rith­mus, der schaut, was der Kun­de gedrückt hat („Neu­ron 5“)

Eine Aus­ga­be­schicht:

  • Ein Algo­rith­mus, der auf Basis eines Schwell­wer­tes und einer Daten­bank einen Preis berech­net und einen Eti­ket­ten­dru­cker ansteuert.

 

Bei­spiel 1:

Neu­ron 1: 15cm

Neu­ron 2: 4cm

Neu­ron 3: Domi­nie­ren­de Far­be ist gelb.

Neu­ron 4: Das Gewicht ent­spricht etwa 70% des äqui­va­len­ten Volu­mens an Wasser

Neu­ron 5: Apfel

Der Kun­de hat mich ver­arscht, das ist eine Banane!“

Das Sys­tem gewich­tet sei­ne Mes­sun­gen hier höher als die Kundeneingabe.

 

Bei­spiel 2:

Neu­ron 1: 12cm

Neu­ron 2: 6cm

Neu­ron 3: grün

Neu­ron 4: Das Gewicht ent­spricht etwa 80% des äqui­va­len­ten Volu­mens an Wasser

Neu­ron 5: Avocado

Eigent­lich blöd, könn­te eine Limet­te oder eine Avo­ca­do sein. Ach, der Kun­de wird ja nicht das bil­li­ge­re Zeug gedrückt haben, also eher eine Avocado.“

 

Das Sys­tem gewich­tet die Kun­den­ein­ga­be in Ver­bin­dung mit einem Preis­ge­fü­ge hier hoch, um zu ent­schei­den, wel­chen Bon es druckt. Es „ent­schei­det“ auf Basis von Daten, wel­che Para­me­ter und Daten es wie gewich­tet und „merkt“ sich belie­big vie­le z.B. unein­deu­ti­ge Situa­tio­nen und wie sel­bi­ge auf­ge­löst wur­den. Danach „kann“ es auf Basis von Daten „ent­schei­den“, wel­chen Bon es z.B. bei einer „nicht stan­dard­kon­for­men Avo­ca­do“ druckt.

Man kann die­sen Pro­zess durch kor­rek­te mensch­li­che Ein­ga­ben beschleu­ni­gen und opti­mie­ren („Trai­ning“). Man kann – falls es einen ande­ren Rück­kopp­lungs­ka­nal gibt – die­se Sys­te­me sich auch selbst opti­mie­ren las­sen – bezo­gen auf Sprach­mo­del­le könn­te man als „Rück­mel­de­ka­nal“ schau­en, wel­che der gene­rier­ten Tex­te per Copy&Paste ver­wen­det wur­den oder wel­che Tex­te wie­der im Netz auftauchen.

Vari­anz „ent­steht“ bei unse­rer Geschich­te mit den Waa­gen durch unkla­re Situa­tio­nen. Im Fal­le von Sprach­mo­del­len kann Vari­anz durch spe­zi­el­le „Neu­ro­nen“ künst­lich erzeugt wer­den, die z.B. betrach­ten, wel­che Tex­te in einem Zeit­raum schon gene­riert wor­den sind und dann „Schwell­wer­te“ ande­rer Neu­ro­nen „ändert“.

Was ein Sprachmodell von einem Menschen unterscheidet

Ein Sprach­mo­dell erfüllt nur eine begrenz­te Auf­ga­ben­stel­lung ganz beson­ders gut: Aus Ein­ga­ben Tex­te erzeu­gen, die für einen mög­lichst gro­ßen Teil von Men­schen authen­tisch wirkt. Men­schen sind in ihren Mög­lich­kei­ten, krea­ti­ve Pro­duk­te zu erschaf­fen da nicht so arg begrenzt. Je mehr „Neu­ro­nen“ durch die Ein­ga­be „getrig­gert“ wer­den, des­to authen­ti­scher wird der Text sein. Daher ist es zumin­dest aus infor­ma­ti­scher Sicht eine Bin­se, wenn Rat­schlä­ge kom­men, ein Sprach­mo­dell mit mög­lichst umfas­sen­den Ein­ga­ben zu speisen.

Begrenzt sind Men­schen jedoch bei der Auf­nah­me von Daten. ChatGPT bricht momen­tan öfter ein­mal zusam­men, weil sehr vie­le Men­schen das Sys­tem gleich­zei­tig nut­zen. Es gibt zwar kei­ne bestä­tig­ten Zah­len, aber die Ein­heit „Mil­lio­nen Anfra­gen pro Sekun­de“ dürf­te als Basis zunächst nicht falsch sein. Mil­lio­nen Anfra­gen bedeu­ten aber auch Mil­lio­nen „Feed­back­ka­nä­le“ zum „Trai­ning“ des neu­ro­na­len Net­zes. Sprach­mo­del­le kön­nen viel mehr Infor­ma­ti­on bewäl­ti­gen als ein ein­zi­ger Mensch. Eigent­lich ist ein Sprach­mo­dell Borg. Wir neh­men die ent­ste­hen­den Tex­te als Pro­duk­te _eines_ Sys­tems wahr. Tech­nisch gese­hen sind es aber die Aus­ga­ben eines Kol­lek­tivs. Der ein­zel­ne Borg agiert ja nicht indi­vi­du­ell, son­dern ver­mit­telt der Figur, die mit ihm kom­mu­ni­ziert, ledig­lich den Anschein einer indi­vi­du­el­len Kom­mu­ni­ka­ti­on.  Wenn die­se Simu­la­ti­on hin­rei­chend gut ist, lässt sie sich für einen rele­van­ten Teil von Men­schen nicht mehr von „ech­ter“ Text­pro­duk­ti­on durch Men­schen unter­schei­den. Mehr braucht es eigent­lich nicht, um (wirt­schaft­lich) als Tech­no­lo­gie erfolg­reich zu sein.

Warum Sprachmodelle emotional wahrgenommen und diskutiert werden

Sprach­mo­del­le sind nüch­tern betrach­tet nicht­ma­te­ri­el­ler Code auf irgend­wel­chen elek­tro­ni­schen Schalt­krei­sen. Ihre Aus­ga­ben drin­gen aber erst­ma­lig leicht benutz­bar in einen Bereich vor, der für Gesell­schaf­ten prä­gend ist: Kom­mu­ni­ka­ti­on. Gesell­schaf­ten kon­sti­tu­ie­ren sich im Wesent­li­chen durch die Art, wie sie intern kom­mu­ni­zie­ren und über wel­che Leit­me­di­en sie das tun. Sprach­mo­del­le decken recht bru­tal auf, wel­che Tex­te einer Gesell­schaft so ein­fach gestrickt sind, dass sie sich mühe­los durch Aus­ga­ben eines IT-Sys­tems erset­zen las­sen. Und das sind zum ganz wesent­li­chen Teil Gebrauchs­tex­te, aber auch Tex­te von Men­schen, die das Schrei­ben (in einer Fremd­spra­che) gera­de ler­nen – also ein Groß­teil von Übun­gen, wie sie in Schul­bü­chern vor­kom­men. Das bedroht zen­tra­le Vor­stel­lun­gen, wie Bil­dung funk­tio­niert und es bedroht Arbeits­rou­ti­nen in Bil­dungs­sys­te­men. In unse­rer Vor­stel­lung waren die­se Tex­te bis­her näm­lich durch­aus nicht unter­kom­plex, son­dern wich­ti­ge Zwi­schen­stu­fen bei der Ent­wick­lung von z.B. Schreibfertigkeiten.

Unterkomplexe Reaktionsmuster auf phänomenologischer Basis

Und es gibt aus mei­ner Sicht unter­kom­ple­xe Reak­tio­nen dar­auf. Ein häu­fi­ger Reflex ist Freu­de dar­über, dass nun end­lich klar wird, wie „stu­pi­de“ Bil­dungs­pro­zes­se eigent­lich sind und wir viel kom­ple­xe­re Auf­ga­ben­for­ma­te brau­chen, z.B. die Bewer­tung der Aus­ga­ben eines Sprach­mo­dells und die Über­ar­bei­tung der­sel­ben. Ohne ein Wis­sen und ohne eige­ne ent­wi­ckel­te Schreib­fer­tig­keit ist das gar nicht so unge­fähr­lich. Im schlimms­ten Fall gibt es eine Aus­ga­be, die dann vom Nut­zen­den an ver­mu­te­te Erwar­tun­gen ange­passt wird.

So wie der Schü­ler, der die Far­be eines Indi­ka­tors so hin­mischt, dass es auf eine Säu­re hin­deu­tet, weil genau das ja auch auf der Fla­sche stand (und das Zeug sau­er schmeckt) – es könn­te aber auch eine ganz ande­re Säu­re oder eine falsch beschrif­te­te Fla­sche gewe­sen sein. MIt Wis­sen dar­über, wie ein Indi­ka­tor funk­tio­niert, wer­den in die­sem Fall ande­re Fra­ge­stel­lun­gen mög­lich. Durch blin­den Glau­ben an den Indi­ka­tor eher nicht.

Rechtfertigungsdruck für tradierte Bildungsprozesse

Was auf jeden Fall geschieht und was für mich der eigent­lich Gewinn dabei ist: Sprach­mo­del­le zwin­gen mich dazu:

  1. Kri­tisch auf für selbst­ver­ständ­lich gehal­te­ne Ver­mitt­lungs­for­men zu schauen
  2. Ver­mitt­lungs­for­men, die der Prü­fung stand­hal­ten, vor der Lern­grup­pe expli­zit recht­fer­ti­gen zu müssen.

Wenn ChatGPT uns alles für eine Erör­te­rung lie­fert, Herr Riecken, war­um müs­sen wir dann noch selbst eine schreiben?

Weil ich es so will und bes­ser weiß, was gut für euch ist!“ könn­te – auch als impli­zi­te Hal­tung – zukünf­tig etwas schwie­ri­ger wer­den – erst­mal gar nicht so komfortabel.

Was ich nicht über Sprachmodelle weiß

Es hat bis­her den Anschein, als sei­en Sprach­mo­del­le wie GPT‑3 bis­her aus­schließ­lich mit Tex­ten trai­niert worde, die Men­schen aus­ge­wählt haben. Da kom­men natür­lich Fra­gen dazu auf, nach wel­chen Kri­te­ri­en die­se Trai­nings­da­ten von wem aus­ge­wählt wor­den sind.

Sprach­mo­del­le sind in einem ers­ten Schritt zunächst nicht in die Lage ver­setzt wor­den, ihre Trai­nings­da­ten „selbst­stän­dig“ aus dem Inter­net her­aus­zu­ho­len. Wel­che Grün­de gibt es eigent­lich dafür?

Sprach­mo­del­le wer­den vie­le Gebrauchs­tex­te erset­zen, die bis­her Domä­nen von Men­schen waren – etwa Sport­be­rich­te. Logisch zuen­de gedacht, wer­den bald wesent­li­che Tei­le einer (west­li­chen) Gesell­schaft nicht mehr ihr Geld mit Schrei­ben ver­die­nen kön­nen. Auch mein Blog kann mühe­los von Aus­ga­ben von Sprach­mo­dell quan­ti­ta­tiv an die Wand gena­gelt und z.B. in Such­ma­schi­nen nicht mehr wahr­nehm­bar sein – mein Blog ist jetzt ein däm­li­ches Bei­spiel, aber was bedeu­tet das insgesamt?

Wird es uns gelin­gen, nen­nens­wer­te Tei­le von Schüler:innen (und uns Lehrer:innen) dazu zu befä­hi­gen, das künf­ti­ge Niveau von Sprach­mo­del­len zu errei­chen? Machen wir uns nicht ganz schön was vor mit der Annah­me, dass gro­ße Tei­le der Schüler:innenschaft in der Lage sein wer­den, Aus­ga­ben von Sprach­mo­del­len „kri­tisch“ zu hin­ter­fra­gen und zu über­ar­bei­ten, WENN uns gleich­zei­tig bewusst ist, dass das Niveau die­ser Aus­ga­ben eher qua­li­ta­tiv stei­gen wird?

 

Aufgaben abarbeiten – was die die beste Strategie?

Wir alle haben jeden Tag eine Fül­le von Auf­ga­ben zu erle­di­gen. Eini­ge bekom­men das sehr gut hin und ant­wor­ten z.B. immer schnell auf Anru­fe oder E‑Mails, schrei­ben Kon­zep­te oder Arti­kel in der vor­ge­ge­ben Zeit und schaf­fen auch sonst sehr viel offen­bar mit spie­len­der Leich­tig­keit. Ande­re ver­zet­teln sich – man bekommt lan­ge kei­ne Rück­mel­dung oder muss ewig oft nachfragen.

Dar­in unter­schei­den sich Men­schen erst­mal gar nicht so sehr von einem Haupt­pro­zes­sor in einem Com­pu­ter. Es ste­hen auch dort begrenz­te Res­sour­cen zur Abar­bei­tung von Auf­ga­ben zur Ver­fü­gung. Es gibt unter­schied­li­che Stra­te­gien, wie ein Betriebs­sys­tem mit Bear­bei­tungs­zeit „umgeht“. Das nennt sich dort „Sche­du­ling“. Lässt sich davon viel­leicht etwas ler­nen für den eige­nen All­tag? Sind viel­leicht sogar All­tags­über­le­gun­gen mit in Betriebs­sys­tem­ar­chi­tek­tu­ren eingeflossen?

Vier gän­gi­ge Ver­fah­ren von soge­nann­tem „Task-Sche­du­ling“ sind unten ein­mal visua­li­siert. Ich idea­li­sie­re in einem ers­ten Schritt ein­mal und neh­me an, dass zu einem Zeit­punkt x sämt­li­che Auf­ga­ben T für einen Tag bereits vor­lie­gen. Die Auf­ga­ben T1 bis T5 benö­ti­gen unter­schied­li­che Zeit­ein­hei­ten (E), um erle­digt wer­den zu kön­nen. Die War­te­zeit mei­nes Gegen­übers auf die Erle­di­gung einer Auf­ga­be ist durch einen grü­nen Pfeil sym­bo­li­siert. Eine wei­te­re Idea­li­sie­rung besteht dar­in, dass wäh­rend der gesam­ten Bear­bei­tungs­zeit kei­ne Unter­bre­chun­gen auftreten.

Strategie 1: First in, first out

Dazu sor­tie­re ich mir die Auf­ga­ben nach der Zeit ihres Ein­tref­fens. Die von Frei­tag­abend kom­men vor denen von Sonn­tag­mit­tag, wenn ich am Mon­tag im Büro sit­ze. Wir schau­en uns jetzt mal die War­te­zei­ten an, die mei­ne Gegen­über haben, wenn ich nach die­sem Prin­zip arbei­te. Alle War­te­zei­ten (grü­ne Pfei­le) addie­ren wir zusam­men. Das sind in unse­rem ers­ten gra­fi­schen Bei­spiel 39 Zeiteinheiten.

Strategie 2: Shortest Processing Time First

Hier pas­siert eine wesent­li­che Ände­rung: Ich sor­tie­re mir die Auf­ga­ben so, dass ich zunächst das erle­di­ge, was schnell geht. Man sieht es schon an der Län­ge der Pfei­le: Die durch­schnitt­li­che War­te­zeit sinkt dras­tisch, d.h. mehr mei­ner Gegen­über erhal­ten schnel­ler von mir eine Ant­wort (26 Zeit­ein­hei­ten). An einem All­tags­bei­spiel: Wenn man an einer Super­markt­kas­se immer die­je­ni­gen mit weni­gen Tei­len vor­lässt und kei­ne neu­en Kun­den zur War­te­schlan­ge hin­zu­kom­men, sinkt im Mit­tel die War­te­zeit für alle. Übri­gens sind wir Men­schen in der Vor­her­sa­ge, wie schnell etwas geht, einer Maschi­ne meist überlegen.

 

Zwischenbilanz

Ein kur­ze mitt­le­re Ant­wort­zeit ist oft genau das, was mich nach außen hin als „orga­ni­siert“ erschei­nen lässt. Intui­tiv wür­den Men­schen mir für kom­ple­xe­re Auf­ga­ben auch mehr Zeit zuge­ste­hen. Wenn ich aber eine ganz kur­ze Fra­ge lan­ge lie­gen las­se, gel­te ich schnell als lang­sam. Einen Com­pu­ter wür­den wir auch als lang­sam emp­fin­den, wenn so etwas ver­meint­lich Bana­les wie die Maus über den Bild­schirm ruckelt. Dass gleich­zei­tig z.B. das Video im Hin­ter­grund schnel­ler ger­en­dert wird, erfas­sen wir intui­tiv nicht. Wir sind aber immer noch äußerst idea­li­siert unterwegs.

 

Strategie 3: Highest Priority First

Am All­tag etwas dich­ter dran ist die Stra­te­gie, nach Prio­ri­tä­ten zu sor­tie­ren. Je dunk­ler die Auf­ga­be T in der fol­gen­den Gra­fik ist, des­to höher ist ihre Prio­ri­tät. Wenn wir die glei­chen Annah­men machen wie für die bei­den ers­ten Stra­te­gien (z.B. alle Auf­ga­ben lie­gen am Tages­be­ginn vor), ist das Ergeb­nis für die mitt­le­ren Ant­wort­zei­ten dras­tisch schlecht, was natür­lich aber auch mit am kon­kre­ten Bei­spiel liegt. In der Ten­denz lässt sich das aber durch­aus verallgemeinern.

Wir stel­len durch die­se Stra­te­gie zwar die wich­tigs­ten Auftraggeber:innen schnell zufrie­den, zah­len das aber mit dem rela­tiv hohen Preis, dass umso mehr Men­schen lan­ge auf unse­re Ant­wort war­ten müssen.

Strategie 4: Preemptive Highest Priority First

Damit wir auch mal den Gegen­pol sehen am Schluss noch mehr Rea­lis­mus mit der Zusatz­an­nah­me, dass Auf­ga­ben unter­schied­li­cher Prio­ri­tät zu unter­schied­li­chen Zei­ten über den Tag hin­zu­kom­men. Auf­ga­ben höhe­rer Prio­ri­tät unter­bre­chen dabei die Abar­bei­tung nied­ri­ger prio­ri­sier­ter Auf­ga­ben. Die­se wer­den dann fort­ge­setzt, wenn alle „höher­wer­ti­gen“ Auf­ga­ben erle­digt sind. Das sieht erst­mal gut aus, scheint ziem­lich opti­mal zu sein und kommt der Rea­li­tät viel­leicht am nächs­ten, aber da ste­cken auch wie­der star­ke ver­steck­te Idea­li­sie­run­gen und Pro­ble­me drin.

  • Es ist wahr­schein­lich, dass nied­rig­prio­ri­sier­te Auf­ga­ben wäh­rend der Abar­bei­tung höher­prio­ri­sier­ter Auf­ga­ben kom­men und nicht wie in mei­nem fik­ti­ven Bei­spiel gleich bear­bei­tet wer­den, weil sie immer gera­de da sind, wenn nichts zu tun ist. Dadurch stei­gen die im Mit­tel erfor­der­li­chen Ant­wort­zei­ten (x+1).
  • Jeder Auf­ga­ben­wech­sel ist res­sour­cen­mä­ßig teu­er. Man muss sich jedes­mal neu ein­den­ken, vor allem, wenn eine kom­ple­xe Auf­ga­be unter­bro­chen wird. Auch ein Betriebs­sys­tem muss Zustän­de von Pro­zes­sen sichern und wie­der­her­stel­len. Das kos­tet Rechenzeit.
  • Immer neue Auf­ga­ben mit hoher Prio­ri­tät kön­nen Auf­ga­ben mit nied­ri­ger Prio­ri­tät ver­drän­gen, sodass sie gar nicht mehr bear­bei­tet wer­den. Bei Betriebs­sys­te­men spricht man davon, dass Pro­zes­se ver­hun­gern, im All­tag blei­ben Ver­walt­un­g­ar­bei­ten ger­ne mal lie­gen – so wie Kor­rek­tu­ren (deren Prio­ri­tät steigt aber mit der Zeit auto­ma­tisch von alleine …).
Wie mache ich das?

Ich kom­bi­nie­re SPF und PHPF. SPF sorgt dafür, dass Ant­wort­zei­ten kurz sind, PHPF lässt mich gegen­über für mich wich­ti­gen Per­so­nen „gut“ daste­hen. Wei­ter­hin ver­su­che ich, indi­rek­te Kom­mu­ni­ka­ti­ons­si­tua­tio­nen zu ver­mei­den. Wenn ich mer­ke, dass jemand etwas für einen ande­ren bei mir lösen möch­te, las­se ich die Anfra­ge ent­we­der bewusst ver­hun­gern oder ver­su­che, eine direk­te Kom­mu­ni­ka­ti­on zu eta­blie­ren. Indi­rek­te Kom­mu­ni­ka­ti­ons­si­tua­tio­nen sind sehr teu­er, weil man die Bedürf­nis­se meh­re­rer Per­so­nen mit­den­ken muss.

Wei­ter­hin ver­mei­de ich in Arbeits­pha­sen Unter­bre­chun­gen bzw. ver­su­che Men­schen klar zu machen, wie pro­ble­ma­tisch Unter­bre­chung sind (spon­ta­nes Vor­bei­kom­men, Tele­fon­an­ru­fe). Als Aus­gleich schaf­fe ich Pha­sen, in denen ich klar signa­li­sie­re: „Ich bin bereit für ‚Wo ich dich gera­de sehe …‘ “. Irgend­was an uns ist ja dann schon anders als bei einem Betriebssystem …

Lehrkräfte gewinnen – Lehrkräftemangel überwinden

Unterrichten ist ein toller Beruf

Lehr­kraft ist ein tol­ler Beruf. Ich gehe mit eini­gen Stun­den nach den Som­mer­fe­ri­en zurück in den Unter­richt, weil mir in den ver­gan­ge­nen Jah­ren das Unter­rich­ten sehr gefehlt hat. Ich wer­de mit mei­ner gerin­gen Stun­den­zahl nicht oder kaum mit den Wid­rig­kei­ten kon­fron­tiert sein.

Das Lehr­kraft­sein ist in Deutsch­land sehr gut bezahlt. Frau­en und Män­ner wer­den gleich ver­gü­tet. Durch die Ver­be­am­tung win­ken wirk­lich aus­kömm­li­che Pen­sio­nen bei einem rund­rum siche­ren Job. Rech­net man die Per­si­ons­leis­tun­gen mit ein, müs­sen in der frei­en Wirt­schaft erheb­li­che Jah­res­ge­häl­ter zur Bedie­nung der pri­va­ten Alters­ver­sor­ge erwirt­schaf­tet wer­den, um dann auf ein ähn­li­ches Loh­ni­veau zu kom­men. Beam­te mit Kin­dern unter 18 Jah­ren kön­nen ihre Arbeits­zeit sehr fle­xi­bel gestal­ten, für allen ande­ren wur­de über Jah­re die fle­xi­ble Reduk­ti­on von Stun­den ermög­licht, soweit „dienst­li­che Grün­de“ nicht entgegenstanden.

Es gibt aus unter­schied­li­chen Grün­den auch ange­stell­te Lehr­kräf­te. Da sieht es deut­lich schlech­ter aus. Vor allem bei der Bezah­lung, den Auf­stiegs­mög­lich­kei­ten inner­halb des Schul­sys­tem und der Rente.

Wir haben einen ekla­tan­ten Man­gel an Lehr­kräf­ten in allen Schul­for­men. An Gym­na­si­en sieht es noch ver­gleichs­wei­se gut aus. Zukünf­tig wird sich die­ser Man­gel immens ver­schär­fen. Irgend­was scheint nicht zu stim­men, obwohl die Arbeits­be­din­gun­gen sicher und gut sind.

Zwei Arbeitsverträge

Jeder Mensch hat zwei Arbeitsverträge.

Der eine regelt das For­ma­le. Wie viel Geld gibt es für wel­che Arbeit? Wie sieht es mit der Ver­ein­bar­keit von Arbeit und Beruf aus? Wie kann ich mei­ne Arbeits­zeit an mei­ne momen­ta­ne Lebens­si­tua­ti­on anpas­sen? Wie viel Urlaub steht mir zu?

Die­ser ers­te Arbeits­ver­trag ist von außen sicht­bar. Im Lehrer:innenberuf für alle – selbst die Ent­loh­nung auf den Cent genau. Die Feri­en­zei­ten. Dar­an ent­zün­den sich mit ste­ter Regel­mä­ßig­keit die übli­chen Kli­schee­dis­kus­sio­nen von „nach­mit­tags frei“ und „12 Wochen Urlaub“. Da sol­len die Lehr­kräf­te auch etwas für leis­ten – so die ein­hel­li­ge Meinung.

Der ande­re Arbeits­ver­trag regelt das Ideel­le: Kann ich sinn­stif­tend arbei­ten? Erfah­re ich Unter­stüt­zung und Aner­ken­nung? Wel­che Hier­ar­chien gibt es und wie lebt Lei­tung die­se? Errei­che ich Zie­le? Wer­de ich den Men­schen in mei­nem beruf­li­chen Umfeld gerecht? Wel­che Erwar­tun­gen stellt die Gesell­schaft an mich?

Die­ser zwei­te Arbeits­ver­trag ist von außen nicht sicht­bar. Defi­zi­te in die­sem Bereich las­sen sich sehr oft durch eine ent­spre­chen­de Kom­pen­sa­ti­on im ers­ten Arbeits­ver­trag aus­glei­chen. Aber das hat Gren­zen. Gren­zen äußern sich dar­in, dass ein Beruf nicht mehr ange­wählt oder ver­las­sen wird – im Lehrer:innenberuf gar nicht so sel­ten durch „inne­re Kündigung“.

In die­sem Sta­di­um wir­ken Anreiz­sys­te­me finan­zi­el­ler Art nicht mehr – eher wird sogar bewusst auf Geld ver­zich­tet, um den ideel­len Arbeits­ver­trag sinn­stif­tend aus­ge­stal­ten zu können.

Das politische Dilemma

Man hat sich aus mei­ner Sicht poli­tik- und behör­den­sei­tig über Jah­re dar­auf ver­las­sen, dass man mit dem for­ma­len Arbeits­ver­trag – vor allem mit der Beam­tung – schon hin­rei­chend punk­ten wird, um immer genü­gend Lehr­kräf­te auf dem frei­en Markt zur Ver­fü­gung zu haben. Lan­ge Zeit war das auch so. Das kippt aber – übri­gens auch ganz ohne die aktu­el­le Flücht­lings­kri­se, die kata­ly­siert das Pro­blem „nur“.

Wahl­wei­se mag auch der eine oder die ande­re Politiker:in dar­auf gesetzt haben, dass sich die Her­aus­for­de­rung zumin­dest teil­wei­se durch Digi­ta­li­sie­rung löst. Das klappt auch so bedingt. Und jetzt steht man da.

Die poli­ti­sche Lösung sieht dann oft so aus, dass man Geld bereit­stellt und in die­sem Fall Kultusbeamt:innen den Auf­trag erteilt, mit die­sem Geld dafür zu sor­gen, dass das Pro­blem weg­geht oder es nach außen zumin­dest so aus­sieht, als wür­de man etwas dafür tun, dass das Pro­blem weggeht.

Hier­ar­chi­sche Sys­te­me nei­gen dann dazu, dar­auf zu schau­en, wie man an dem for­ma­len Arbeits­ver­trag (z.B. „Bonus­zah­lun­gen“) so schrau­ben kann, dass mehr Men­schen kom­men bzw. die­je­ni­gen blei­ben, die schon im Sys­tem sind. Das Pro­blem liegt aber gar nicht auf der for­ma­len Ebene.

Alter­na­tiv kann man die bis­her kulan­ten Teil­zeit­re­ge­lun­gen beschnei­den oder beam­ten­recht­li­che Mit­tel wie die Abord­nung oder Ver­set­zung nut­zen, um Per­so­nal­res­sour­cen bes­ser aus­zu­nut­zen. Bei­des dürf­te aber zu Las­ten des ideel­len Arbeit­ver­tra­ges gehen und das Pro­blem in ziem­lich kur­zer Zeit ziem­lich ver­schär­fen. Aber: Wir wer­den die­se Maß­nah­men mei­ner Mei­nung nach sehen.

Alles, was man kurz­fris­tig tun kann, ver­schärft das Pro­blem. Sinn­vol­le­re Maß­nah­men wir­ken nicht recht­zei­tig vor der nächs­ten Wahl oder sind wahl­wei­se nicht „öffent­lich­keits­gän­gig“. Mit sym­bol­träch­ti­gen öffent­lich­keits­gän­gi­gen Maß­nah­men wer­den im bes­ten Fall knap­pe Res­sour­cen nicht sinn­voll gebunden.

Was also tun?

Men­schen blei­ben in einem Beruf, den sie für sich als sinn­stif­tend erle­ben – das ist mei­ne Über­zeu­gung. Daher kann der Weg nur über den zwei­ten Arbeits­ver­trag führen.

War­um schau­en wir nicht ein­mal ganz kri­tisch auf das Refe­ren­da­ri­at? Ich war erstaunt, was für einen schlech­ten Ruf die­se Aus­bil­dungs­pha­se ins­ge­samt bei mei­nen Student:innen hat­te. Wir soll­ten die­se Wahr­neh­mung wirk­lich ernst neh­men, auch unse­re eige­ne … Viel­leicht hilft schon das Ange­bot(!) einer exter­nen(!) frei­wil­li­gen(!) Super­vi­si­on, um Wahr­neh­mung einzuordnen.

War­um machen wir es gera­de Berufsanfänger:innen am Anfang nicht etwas leich­ter, indem wir das Depu­tat zeit­lich begrenzt sen­ken? Natür­lich ver­schen­ken wir dadurch Unter­richts­stun­den, aber wel­che Lehr­kraft ist bes­ser für das Sys­tem: Die­je­ni­ge, die nicht da ist oder die­je­ni­ge, die zumin­dest 80% arbei­tet? (Ich weiß, dass das recht­lich schwie­rig ist – aber Recht lässt sich gestalten).

Schul­for­men ohne die Mög­lich­keit(!) des Erwerbs eines Abiturs wer­den gesell­schaft­li­che Pro­ble­me akku­mu­lie­ren. Immer. Wir soll­ten drin­gend davon weg­kom­men und eine ech­te Zwei­glied­rig­keit ins Auge fas­sen. Es hat Grün­de, war­um ins­be­son­de­re an Ober- und sons­ti­gen „Mit­tel­schu­len“ der Lehr­kräf­te­man­gel ekla­tant ist.

Die ver­schie­de­nen Hier­ar­chie­be­nen im Schul­sys­tem müs­sen ihre Wirk­lich­kei­ten abglei­chen und erfah­ren. Behördenmitarbeiter:innen soll­ten ver­bind­lich im Fünf­jah­res­tur­nus an Schu­len z.B. im Büro ein­ge­setzt wer­den. Ministeriumsmitarbeiter:innen soll­ten in Kon­takt mit Schu­le und Unter­richt kom­men, z.B. in Form von Hos­pi­ta­tio­nen. Lehr­kräf­te soll­ten Ver­fah­ren in Schul­be­hör­den haut­nah durch Hos­pi­ta­tio­nen erle­ben könn­ten oder es soll­te nie­der­schwel­li­ge Fall­be­spechun­gen mit unter­schied­li­chen Hiera­chie­ebe­nen geben. Wir brau­chen drin­gend gegen­sei­ti­ge Ein­bli­cke in die Arbeit.

Wir soll­ten uns als Gesell­schaft fra­gen, in wel­chem Ver­hält­nis per­sön­li­che Bedürf­nis­se und Lebens­ent­wür­fe zu der Erfül­lung des All­ge­mein­wohls ste­hen. Der Lehrer:innenberuf ist wie kein ande­rer einer, der im All­ge­mein­wohl die­nen soll­te. Das bringt bestimm­te Ein­schrän­kun­gen im per­sön­li­chen Umfeld mit sich, die aber an ande­rer Stel­le kom­pen­siert wer­den – z.B. durch den for­ma­len Arbeits­ver­trag im Fal­le der Verbeamtung.

Das löst die momentane Herausforderung nicht

Nein. Nichts davon löst das. Wir müs­sen Untericht kurz­fris­tig wahr­schein­lich tat­säch­lich strei­chen und damit das Pro­blem „öffent­lich­keits­gän­gig“ machen. Das ist eine poli­ti­sche Bank­rott­erklä­rung. Aber der Glau­be, lang­fris­tig ent­stan­de­ne Pro­ble­me durch kurz­fris­ti­ge Maß­nah­men lösen zu kön­nen, ist bes­ten­falls naiv – eben­so die Absicht, kon­kret „Ver­ant­wort­li­che“ für das Dilem­ma benen­nen zu wol­len. Dann weiß man zwar, dass es an Herrn Mey­er und Frau Schul­ze liegt, aber das Pro­blem ist ja immer noch da.

 

 

1 2 3 4 147