Grundkompetenzen beim Spiegel

21. Juni 2026

Bildschirmfoto 2026 06 21 um 14 31 07
src: click

Abofallen-Redakteur.

Was die NZZ nicht schafft, schafft Springer

21. Juni 2026

Bildschirmfoto 2026 06 21 um 10 11 56
src: cick

edit: Der Vor­teil von frei Schnauze:

https://www.berliner-zeitung.de/article/das-waere-ja-der-worst-case-dieter-bohlen-hat-angst-vor-einem-sieg-der-ukraine-10117063

Gut, wenn man die Bevöl­ke­rung seit fünf Jah­ren dazu belo­gen hat, was wir eigent­lich machen, und ihr nichts dazu ver­mit­telt hat, …

Und die öffent­li­che Mei­nung durch Medi­en und trus­ted Flag­ger mani­pu­liert hat…

Ist am Ende DSDS gefähr­det, oder so… 

Wo blei­ben eigent­lich die Honeyt­raps, wenn man sie braucht, der braucht grad drin­gend eine neue Freun­din… 😉 *sar­kas­mus*

Neues aus der Kategorie “ah eh schon”

20. Juni 2026

Bildschirmfoto 2026 06 20 um 16 23 53
src: click

Wobei, man muss das auch posi­tiv sehen, Deutsch­land plant neue Inves­ti­tio­nen in Leo­pard II.

edit: Bit­te lie­ber Herr­gott, mach dass das Kopf­weh weg­geht: click (Stich­wort “Das Pro­blem mit den Molekülen”)

Wenn die FAZ Digitalwirtschaft - AI Berichterstattung schreibt

20. Juni 2026

Die euro­päi­sche Hoff­nung trägt einen Namen, und es ist stets der­sel­be: Mis­tral. Von Bru­no Retail­leau, dem kon­ser­va­ti­ven frü­he­ren Innen­mi­nis­ter, bis zu Jor­dan Bar­del­la vom Ras­sem­ble­ment Natio­nal ver­wei­sen fran­zö­si­sche Poli­ti­ker auf das Pari­ser KI-Unternehmen. Sein quell­of­fe­nes Pro­gram­mier­mo­dell Devs­tral läuft auf gewöhn­li­cher Rechen­tech­nik und reicht an die bes­ten geschlos­se­nen Model­le heran.

src: click

AMAZING!

Bildschirmfoto 2026 06 20 um 11 43 54

Such ama­zing, dass bei den aktu­el­len Reben­ches den Dreck kei­ner mehr tes­tet, weil das hin­ten und vor­ne nicht die tool­call Fähig­kei­ten mit­bringt, dies aktu­ell braucht -- aber Haupt­sa­che die FAZ hat wie­der recherchiert…

Das let­ze Mal dass die Fran­zo­sen noch jemand Unab­hän­gi­ges gebech­markt hat, war im Febru­ar die­sen Jah­res - und da hat­te Devs­tral, bei swe-rebench eine Pass@5 per­cen­ta­ge von 59%.

Bildschirmfoto 2026 06 20 um 11 55 20

Gut sagen sie, das ist ja nicht so schlimm, das sind ja nur 10 Pro­zent im Ver­gleich zu den aktu­el­len Topmodellen!

Jo bei nem varia­blen Schwie­rig­keits­grad an neu­en Problemen, …

Bildschirmfoto 2026 06 20 um 12 01 03

Zum sel­ben Test­zeit­punlt im Febru­ar - erreichte

Step 3.5 Flash von Ste­pfun 71,9%

und

GPT 5.2 medi­um with tools 73,7%

Zwei Test­zeit­punk­te davor erreichte 

GPT OSS 120b high with tools 62,5%

und jetzt schaun wir mal auf den Preis­punkt, nicht?

Devs­tral 2 2512: $0,40 / $2
Ste­pfun 3.7 Flash: $0,20 / $1,15
GPT OSS 120b: 0,039 / $0,18
GPT-5.2 Chat: $1,75 / $14
Opus 4.8 $5 / $25

Gut für die deutsch­spra­chi­gen Qua­li­täts­zei­tungs­le­ser wirds reichen…

Gut wer­den sie jetzt sagen, aber ein Ver­gleichs­wert von einem bes­se­ren, güns­ti­ge­ren chi­ne­si­schen Open weights Modell -- gibts da nichts wor­an mans so im Zeit­ver­lauf ver­glei­chen könn­te. Klar.

GLM 4.7 mit Tools $0,40 / $1,75

Bildschirmfoto 2026 06 20 um 12 13 24

Komisch, bei uns in Euro­pa ver­wen­den ja alle Mis­tral, und dann beschwe­ren sie sich dass die Modell schlecht sind. Also ich seh da kei­nen Zusammenhang…

Gut, also das ist SWE Bench reben­ched - also eh nur coding, wie siehts denn in ande­ren Fel­dern aus?

Gut dass sie fragen:

GLM 5.2 (max): ($1,20 / $4,10) - eben­falls open weights
Devs­tral 2 2512: ($0,40 / $2)
Mis­tral 3.5 Medi­um: ($1,50 / $7,50)
Mis­tral 3 Lar­ge: ($0,50 / $1,50)
Ste­pfun 3.7 Flash ($0,20 / $1,15) - eben­falls open weights

https://artificialanalysis.ai/models/glm-5-2
https://artificialanalysis.ai/models/devstral-2
https://artificialanalysis.ai/models/mistral-medium-3-5
https://artificialanalysis.ai/models/mistral-large-3
https://artificialanalysis.ai/models/step-3-7-flash

GDPval-AA v2 (SOTA Clau­de Fable 5: 64%)
Agen­tic real world tasks

GLM 5.2 (max): 51%
Devs­tral 2: nicht mehr getestet
Mis­tral medi­um 3.5: 21%
Mis­tral lar­ge 3: nicht mehr getestet
Step 3.7 Flash: 26%

R3-Banking (SOTA GPT 5.5 xhigh: 31%)
Agen­tic tool use

GLM 5.2 (max): 27%
Devs­tral 2: nicht mehr getestet
Mis­tral medi­um 3.5: 14%
Mis­tral lar­ge 3: nicht mehr getestet
Step 3.7 Flash: 11%

Ter­mi­nal Bench v2.1 (SOTA Clau­de Fable 5: 85%)
Agen­tic ter­mi­nal use and coding

GLM 5.2 (max): 78%
Devs­tral 2: nicht mehr getestet
Mis­tral medi­um 3.5: 51%
Mis­tral lar­ge 3: nicht mehr getestet
Step 3.7 Flash: 36%

Sci­Code (SOTA Clau­de Fable 5: 60%)
Coding

GLM 5.2 (max): 50%
Devs­tral 2: 33%
Mis­tral medi­um 3.5: 40%
Mis­tral lar­ge 3: 36%
Step 3.7 Flash: 40%

Humanity’s last exam (SOTA Clau­de Fable 5: 53%)
Rea­so­ning and Knowledge

GLM 5.2 (max): 40%
Devs­tral 2: 4%
Mis­tral medi­um 3.5: 13%
Mis­tral lar­ge 3: 4%
Step 3.7 Flash: 20%

GPQA Dia­mond (SOTA Gemi­ni 3.1 Pro Pre­view: 94%)
Sci­en­ti­fic Reasoning

GLM 5.2 (max): 89%
Devs­tral 2: 59%
Mis­tral medi­um 3.5: 75%
Mis­tral lar­ge 3: 68%
Step 3.7 Flash: 81%

CritPt (SOTA Clau­de Fable 5: 29%)
Phy­sics reasoning

GLM 5.2 (max): 21%
Devs­tral 2: 0%
Mis­tral medi­um 3.5: 0%
Mis­tral lar­ge 3: 0%
Step 3.7 Flash: 2%

AA-Omniscience Accu­ra­cy (SOTA Clau­de Fable 5: 61%)
Knowledge

GLM 5.2 (max): 25%
Devs­tral 2: 21%
Mis­tral medi­um 3.5: 26%
Mis­tral lar­ge 3: 24%
Step 3.7 Flash: 25%

AA-Omniscience Non-Hallucination Rate (SOTA Min­Max M3 84%)
hal­lu­ci­na­ti­on rate (inver­se, so hig­her is better)

GLM 5.2 (max): 72%
Devs­tral 2: 15%
Mis­tral medi­um 3.5: 18%
Mis­tral lar­ge 3: 16%
Step 3.7 Flash: 16%

AA-LCR (SOTA GPT 5.5 xhigh: 74%)
Long con­text reasoning

GLM 5.2 (max): 71%
Devs­tral 2: 30%
Mis­tral medi­um 3.5: 61%
Mis­tral lar­ge 3: 35%
Step 3.7 Flash: 64%

IFBench (SOTA Mini­Max M3: 83%)
Inst­ruc­tion following

GLM 5.2 (max): 73%
Devs­tral 2: 38%
Mis­tral medi­um 3.5: 69%
Mis­tral lar­ge 3: 36%
Step 3.7 Flash: 67%

Ich mein, sehen wirs posi­tiv, dadurch dass Mis­tral seit Dezem­ber 2025 kei­ne gro­ßen Model­le ver­öf­fent­licht und nur noch Mis­tral Small und Medi­um released, hat Euro­pa ja sehr viel Strom gespart. Wobei nein, auch das nicht - sie trai­nie­ren schon noch grö­ße­re nur ver­öf­fent­li­chen sie sie nicht mehr - weils öko­no­misch kei­nen Sinn mehr macht.

Viel­leicht noch zwei Punk­te als Randnotiz:

Ste­pFun 3.7 Flash is a mul­ti­modal Mixture-of-Experts (MoE) model fea­turing 198 bil­li­on total parameters.

Mis­tral Medi­um 3.5 is a den­se trans­for­mer model with 128 bil­li­on total para­me­ters. Unli­ke Ste­pFun 3.7 (which uses a spar­se MoE design to only run 11B acti­ve para­me­ters), Mis­tral Medi­um is ful­ly den­se, mea­ning all 128 bil­li­on para­me­ters are acti­ve for every sin­gle token pro­ces­sed during inference.

TOI, TOITOI!

Moment, mal - für den Preis, was krieg ich denn da an token pro Sekun­de raus?

Ste­pfun 3.7 Flash: 55 tps
Mis­tral 3.5 Medi­um: 24 tps (supi und das nur bei 5 mal so viel ein­ge­setz­ter Hard­ware, weil den­se - zum Schnäpp­chen vom nur sie­ben­fa­chen Preis!)

Kann ich eigent­lich auch 14 fach über­be­zah­len, damit das dop­pelt so schnell wird? Nein kann ich nicht?

Scha­de, ich hät­te auch schon einen Abnehmer!

Bildschirmfoto 2026 06 20 um 17 12 12
src: click

Fuck me, wie ist das jetzt mit den Vorbedingungen der Kaja Kallas zu vereinbaren?

19. Juni 2026

Sie wis­sen schon, die die der NZZ - die von Bür­gen­stock ablen­ken woll­te so hei­lig waren?

Sie wis­sen schon, die die den E3 so wich­tig waren dass sie nie kon­kret aus­spre­chen konn­ten, was die­se Vor­be­din­gun­gen eigent­lich beinhal­ten sollten.

Bildschirmfoto 2026 06 19 um 21 30 07
src: click

Gut, der deutsch­spra­chi­gen Qua­li­täts­pres­se wird schon wie­der was einfallen…

Den hohen Stel­len­wert von Ver­mitt­lun­gen, ohne Ver­hand­lun­gen zu beto­nen, zum Beispiel.

Die Euro­pä­er zie­hen der­weil für Selen­skyj die US wie­der auf ihre Sei­te, gell “Nicht mehr Jer­mak Office”?

Poli­tik ist ein schmut­zi­ges Geschäft. Und min­des­tens drei Euro­pä­er lügen immer.

edit:

Bra­si­li­en also. Wenn ihnen die US als Ver­hand­ler zu ziel­ori­en­tiert waren, und sie als Ukrai­ne bereits die guten Diens­te der Tür­kei, der UAE und der Schweiz bis aufs Blut ver­arscht haben, sodass die nicht mehr wol­len, dass sich ihr Prä­si­dent bei denen bli­cken lässt, sie aber unbe­dingt ein Rei­se Sche­du­le für ihren 60iger IQ Prä­si­den­ten für die nächs­ten zwei Jah­re brau­chen um ihre Bevöl­ke­rung wei­ter zu ver­ar­schen bis Trump abge­wählt wird - war­um nicht Bra­si­li­en!? Dort ists doch auch schön.

Bildschirmfoto 2026 06 20 um 04 35 17
src: click

Man hört Lula ist schon ganz außer sich vor Freu­de, dass die Pro­pa­gan­da der Ukrai­ne jetzt die US als Ver­hand­lungs­füh­rer gegen das so pres­ti­ge­träch­ti­ge Bra­si­li­en als Ver­hand­lungs­füh­rer getauscht haben - unter dem Jubel der Euro­pä­er, dass sich Selen­skyj ENDLICH vom US Frie­dens­for­mat lösen konn­te, um die US über die Euro­pä­er auf sei­ne Sei­te zu zie­hen, war­um also nicht noch Bra­si­li­en über die nächs­ten zwei Jah­re bis aufs Blut ver­ar­schen, wäh­rend man dar­auf beharrt, dass bei sei­nen Ver­hand­lun­gen die E3 mit am Tisch sit­zen müs­sen, aber Chi­na nicht…

Bra­si­li­en, Sam­ba, Son­ne, und Selen­skyj Pres­se­auf­trit­te für zwei wei­te­re vol­le Jahre.

Selen­skyj der zum Zucker­hut fährt um sich zu beschwe­ren, dass Putin nicht dort ist um mit ihm zu verhandeln.

Viel­leicht kann er dort auch ein Ste­fan Zweig Zitat neu inter­pre­tie­ren, das wär doch gut für die Pressestimmen.

Pro­pa­gan­da kann so schön sein. Und so som­mer­lich, locker und erbaulich.

Bra­si­li­en also. Die haben his­to­risch auch nicht so Pro­ble­me mit den Nazis.

Bildschirmfoto 2026 06 20 um 04 15 14
src: click

Nie­mand steht so sehr für einen gerech­ten Frie­den wie Jair Bol­so­na­ro, den Tip hat das ukrai­ni­sche Pre­si­den­ti­al Office frisch von ihren Freun­den im eco­no­mics depart­ment der Uni­ver­si­tät von Chicago.

Eine Fra­ge noch: Wie sicher ist jetzt Brasilien?

Bildschirmfoto 2026 06 20 um 04 32 19
src: click

Sehr sicher oder? Sicher wie ne Bank, vor der Jesus-Statue in Rio.

Ich küm­mer mich schon mal ums Promomaterial…

Bildschirmfoto 2026 06 20 um 04 42 04

☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮ ☮

Openrouter image output preview rev 1

Bildschirmfoto 2026 06 20 um 05 25 09

Kau­fen sie ihr “Bra­si­lia 2026 - paz com os pre­si­den­tes!” Friedens-Tshirt noch heu­te. Von jedem Kauf gehen 15 Euro an die ukrai­ni­sche Drohen-Initiative von Timo­thy Snyder!

Der US-amerikanische His­to­ri­ker und Yale-Professor Timo­thy Sny­der enga­giert sich als offi­zi­el­ler Bot­schaf­ter der ukrai­ni­schen Spen­den­platt­form UNITED24 aktiv für meh­re­re Drohnen- und Luftabwehr-Initiativen. Anstatt rein aka­de­misch zu blei­ben, sam­melt er gezielt Gel­der, um die ukrai­ni­sche Zivil­be­völ­ke­rung und Infra­struk­tur vor rus­si­schen Angrif­fen zu schützen.

Zitat: Goog­le Gemini

Jedes “Bra­si­lia 2026 - paz os pre­si­den­tes!” T-Shirt ist aus 30% recy­c­le­ba­rer Baum­wol­le gefertigt.

edit:

Moment, ich hör grad, das pro­eu­ro­päi­sche Polen hat dazu auch eine Meinung:

Bildschirmfoto 2026 06 20 um 07 51 02
src: click

Grü­ße an Alp­bach bitte!