Meta…

23. Oktober 2025

Bildschirmfoto 2025 10 23 um 21 32 48
src: click

Beispiel 1:

Model: Deep­seek 3.2 Exp

Input: Wri­te a sati­ri­cal text based on the fol­lowing: EU-Chefs zie­hen neu­em Emis­si­ons­han­del die Zähne
Kos­ten­wahr­heit für das Hei­zen und Tan­ken? Die­se Idee war noch vor weni­gen Jah­ren poli­ti­scher Main­stream. Heu­te set­zen die EU-Chefs alles dar­an, die Aus­wei­tung des Emis­si­ons­han­dels zu kappen.

Out­put:

Brüs­se­ler Pres­se­mit­tei­lung – EILMELDUNG

Titel: Kli­ma­schutz mit Samt­hand­schu­hen: EU-Chefs erklä­ren Emis­si­ons­han­del für zahnlos
Unter­ti­tel: His­to­ri­scher Beschluss: Ab sofort gel­ten CO₂-Emissionen nur noch, wenn sie nie­man­dem wehtun

BRÜSSEL – In einer bahn­bre­chen­den Nacht­sit­zung haben sich die Staats- und Regie­rungs­chefs der Euro­päi­schen Uni­on dar­auf geei­nigt, dem Emis­si­ons­han­dels­sys­tem (ETS) sämt­li­che Zäh­ne zu zie­hen. „Wir haben erkannt: Schar­fe Zäh­ne bei­ßen manch­mal. Das ist unan­ge­nehm“, erklär­te ein hoch­ran­gi­ger Diplo­mat unter dem Schutz der Anony­mi­tät, wäh­rend er genüss­lich an einem Steak kau­te. „Kos­ten­wahr­heit? Das klang vor zehn Jah­ren noch wie eine gute Idee. Heu­te wis­sen wir: Die ein­zi­ge Wahr­heit, die die Bür­ger hören wol­len, ist, dass alles bezahl­bar bleibt.“

Das neue Modell sieht vor, dass Zer­ti­fi­ka­te für Kohlendioxid-Emissionen künf­tig nicht mehr ver­stei­gert, son­dern ver­schenkt wer­den – und zwar in bunt bedruck­ten Über­ra­schungs­tü­ten, um den Spaß­fak­tor zu erhö­hen. Zusätz­lich wird eine „Kuschel­klau­sel“ ein­ge­führt: Soll­te die CO₂-Bepreisung irgend­wem weh­tun, wird sie sofort aus­ge­setzt und durch eine herz­li­che Umar­mung ersetzt.

War­um soll­ten wir das Hei­zen und Tan­ken teu­rer machen, nur weil die Pole schmel­zen?“, frag­te ein wei­te­rer EU-Spitzenpolitiker rhe­to­risch und schob sich demons­tra­tiv eine Schei­be Wurst in den Mikro­wel­len­ofen. „Die Lösung liegt nicht in unbe­que­men Maß­nah­men, son­dern dar­in, das Wort ‚Emis­si­ons­han­del‘ durch ‚kos­ten­lo­ses Luftpartikel-Bonusprogramm‘ zu ersetzen.“

Kri­ti­ker der Ent­schei­dung wei­sen dar­auf hin, dass die Kli­ma­kri­se nicht mit Samt­hand­schu­hen, son­dern mit kon­se­quen­tem Han­deln bekämpft wer­den müs­se. Sie wur­den umge­hend ein­ge­la­den, ihre Sor­gen beim neu geschaf­fe­nen „EU-Amts für beru­hi­gen­de Wor­te und war­me Geträn­ke“ vorzutragen.

Die Kom­mis­si­on plant bereits die nächs­ten Schrit­te: Soll­te das 1,5-Grad-Ziel ver­fehlt wer­den, wird es kur­zer­hand auf 3,0 Grad ange­ho­ben. „Pro­blem gelöst“, so der ein­stim­mi­ge Tenor. „Haupt­sa­che, heu­te hat kei­ner was davon gemerkt.“ 

Sati­re erfolg­reich produziert.

Beispiel 2:

Models: Clau­de Son­net 4-5 0929 thin­king 32k and Gemi­ni 2.5 pro

Input: you are a sati­re detec­tor. is the fol­lowing satire?

[inser­ted out­put from deep­seek 3.2 exp]

Out­put:

Bildschirmfoto 2025 10 23 um 21 37 04

Sati­re erfolg­reich erkannt. (So you could ask for detec­tion in your news retrie­val pro­cess, if you crea­te a mul­ti step rea­so­ning tool chain, …)

Beispiel 3:

Sie hal­lu­zi­nie­ren, neh­men es mit Quel­len nicht so genau…

Mein Apo­the­ker heu­te zu mir: Ator­va­s­ta­tin ist ein Sta­tin, die müs­sen sie immer am Abend neh­men, nie in der Früh.

Ich: Mach ich eh, aber weils mich inter­es­siert, warum?

Apo­the­ker: Das wirkt auf Blut­fet­te, am Tag essen Sie, das wirkt nur am Abend.

Ich: Dan­ke.

Ich 10 Sekun­den später:

Hey GLM 4.6, ver­wen­de die perplexity.ai search API mit out­put limit 2048 pro Such­re­sul­tat um mir Fol­gen­des zu beantworten: 

War­um Sta­ti­ne (Ator­va­s­ta­tin) am Abend einnehmen?

# War­um Sta­ti­ne (Ator­va­s­ta­tin) am Abend einnehmen?

Die Emp­feh­lung, Sta­ti­ne ein­schließ­lich Ator­va­s­ta­tin am Abend ein­zu­neh­men, hat wis­sen­schaft­li­che Grün­de, die mit dem kör­per­ei­ge­nen Cho­le­ste­rin­stoff­wech­sel zusammenhängen.

## Der zir­ka­dia­ne Rhyth­mus der Cholesterinproduktion

Die kör­per­ei­ge­ne Cho­le­ste­rin­pro­duk­ti­on folgt einem tages­zeit­li­chen Rhyth­mus. Das Enzym HMG-CoA-Reduktase, das für die Cho­le­ste­rin­syn­the­se in der Leber ver­ant­wort­lich ist, zeigt eine deut­li­che tages­zeit­li­che Schwan­kung in sei­ner Akti­vi­tät [citation,cardiopraxis.de](87371e):

- Die Akti­vi­tät die­ses Enzyms ist am frü­hen Nach­mit­tag am niedrigsten
- Sie steigt dann um mehr als das 4-fache an
- Gegen Mit­ter­nacht erreicht sie ihren Gipfel

Da die Cho­le­ste­rin­pro­duk­ti­on nachts am höchs­ten ist, wäre eine abend­li­che Ein­nah­me von Sta­ti­nen theo­re­tisch am effek­tivs­ten, um den Cho­le­ste­rin­spie­gel zu sen­ken [citation,herzstiftung.de](95502a).

## Unter­schie­de zwi­schen ver­schie­de­nen Statinen

Bei der Fra­ge des opti­ma­len Ein­nah­me­zeit­punkts muss man jedoch zwi­schen ver­schie­de­nen Sta­ti­nen unterscheiden:

### Kurz wirk­sa­me Statine
Sta­ti­ne mit kur­zer Halb­werts­zeit wie:
- Sim­va­s­ta­tin (Halb­werts­zeit 5 Stun­den) - Pra­va­sta­tin (Halb­werts­zeit ca. 2 Stun­den) soll­ten unbe­dingt abends ein­ge­nom­men wer­den, da sie zur Zeit der höchs­ten Cho­le­ste­rin­pro­duk­ti­on wirk­sam sein müs­sen [citation,gpnotebook.com](4c5417). ### Lang wirk­sa­me Sta­ti­ne Ator­va­s­ta­tin hat eine deut­lich län­ge­re Halb­werts­zeit von etwa 14 Stun­den, und es hat sogar akti­ve Meta­bo­li­ten mit Halb­werts­zei­ten zwi­schen 20 und 30 Stun­den [citation,gpnotebook.com](4c5417). Auf­grund die­ser lan­gen Wirk­dau­er bleibt der Wirk­stoff wäh­rend der Nacht im Kör­per, unab­hän­gig davon, ob er mor­gens oder abends ein­ge­nom­men wur­de. ## Was bedeu­tet das für Ator­va­s­ta­tin kon­kret? Für Ator­va­s­ta­tin gilt: 1. **Gerin­ger Unter­schied in der Wirk­sam­keit**: Bei Ator­va­s­ta­tin ist der Unter­schied in der cho­le­ste­rin­sen­ken­den Wir­kung zwi­schen mor­gend­li­cher und abend­li­cher Ein­nah­me nur gering [citation,herzstiftung.de](95502a). 2. **Regel­mä­ßig­keit ist wich­ti­ger als der Zeit­punkt**: Die ent­schei­den­de Vor­aus­set­zung für den Erfolg der The­ra­pie ist die regel­mä­ßi­ge Ein­nah­me. Der Effekt von ver­ges­se­nen Tablet­ten auf die Cho­le­ste­rin­sen­kung ist ein Viel­fa­ches grö­ßer als der Unter­schied zwi­schen den Zeit­punk­ten der Ein­nah­me [citation,herzstiftung.de](95502a). 3. **Mög­lich­keit der indi­vi­du­el­len Anpas­sung**: Ator­va­s­ta­tin kann zu jeder Tages­zeit ein­ge­nom­men wer­den, solan­ge die Ein­nah­me regel­mä­ßig erfolgt. Die Wahl des Zeit­punkts soll­te sich dar­an ori­en­tie­ren, wann die Ein­nah­me am bes­ten in den Tages­ab­lauf inte­griert wer­den kann [citation,youtube.com](fb363b). ## Emp­feh­lung in der Pra­xis Obwohl Ator­va­s­ta­tin theo­re­tisch zu jeder Tages­zeit ein­ge­nom­men wer­den kann, wird aus fol­gen­den Grün­den oft zur abend­li­chen Ein­nah­me gera­ten: 1. **Leicht bes­se­re Wirk­sam­keit**: Auch wenn der Unter­schied gering ist, ist die cho­le­ste­rin­sen­ken­de Wir­kung bei abend­li­cher Ein­nah­me mini­mal bes­ser [citation,cardiopraxis.de](87371e). 2. **Redu­zie­rung der Neben­wir­kun­gen**: Bei glei­cher Wir­kung kann durch die abend­li­che Ein­nah­me mög­li­cher­wei­se eine gerin­ge­re Dosis aus­rei­chen, was das Risi­ko von Neben­wir­kun­gen ver­rin­gern könn­te [citation,cardiopraxis.de](87371e). 3. **Ver­ein­fa­chung bei Kome­di­ka­ti­on**: Wenn bereits ande­re Medi­ka­men­te abends ein­ge­nom­men wer­den, kann die gemein­sa­me Ein­nah­me mit Ator­va­s­ta­tin die Com­pli­an­ce ver­bes­sern [citation,herzstiftung.de](95502a). ## Fazit Bei Ator­va­s­ta­tin ist die regel­mä­ßi­ge Ein­nah­me wich­ti­ger als der genaue Zeit­punkt. Obwohl die abend­li­che Ein­nah­me auf­grund des zir­ka­dia­nen Rhyth­mus der Cho­le­ste­rin­pro­duk­ti­on theo­re­tisch sinn­voll ist, kann Ator­va­s­ta­tin auf­grund sei­ner lan­gen Halb­werts­zeit auch mor­gens ein­ge­nom­men wer­den, ohne dass die Wirk­sam­keit wesent­lich beein­träch­tigt wird [citation,gelbe-liste.de](1d9f64). Wäh­len Sie den Zeit­punkt, der Ihnen die bes­te Gewähr für eine regel­mä­ßi­ge Ein­nah­me bie­tet. Wenn Sie bereits ande­re Medi­ka­men­te abends ein­neh­men, kann es sinn­voll sein, auch Ator­va­s­ta­tin abends ein­zu­neh­men. Ansons­ten kön­nen Sie den Zeit­punkt wäh­len, der am bes­ten zu Ihrem Tages­ab­lauf passt. 

Ich: War­um sind Sta­ti­ne zum Teil unpopulär/verschrien?

# War­um Sta­ti­ne zum Teil unpopulär/verschrien sind

Sta­ti­ne gehö­ren zu den am meis­ten ver­ord­ne­ten Medi­ka­men­ten welt­weit, sto­ßen aber in der Öffent­lich­keit und bei Pati­en­ten auf erheb­li­che Skep­sis. Die­se Unpo­pu­la­ri­tät beruht auf meh­re­ren Fak­to­ren, die ich im Fol­gen­den erläutere:

## Ver­brei­te­te Fehl­in­for­ma­tio­nen und Mythen

Einer der Haupt­grün­de für die Skep­sis gegen­über Sta­ti­nen sind die weit­ver­brei­te­ten Fehl­in­for­ma­tio­nen und Mythen, die über die­se Medi­ka­men­te kur­sie­ren [citation,herzstiftung.de](99d99f). Dazu gehören:

- **Der Mythos vom “Cholesterin-Bluff”**: Die Behaup­tung, dass hohe Cho­le­ste­rin­wer­te nicht schäd­lich sei­en und die Statin-Therapie nur der Phar­ma­in­dus­trie die­ne. Wis­sen­schaft­lich ist jedoch ein­deu­tig belegt, dass erhöh­tes LDL-Cholesterin die Ent­wick­lung von Arte­rio­skle­ro­se und damit Herz­in­farkt und Schlag­an­fall ver­ur­sacht [citation,herzstiftung.de](99d99f).

- **Ver­harm­lo­sung des Nut­zens**: Trotz über­zeu­gen­der wis­sen­schaft­li­cher Bele­ge aus zahl­rei­chen Stu­di­en, die zei­gen, dass Sta­ti­ne das Risi­ko für Herz­in­farkt und Schlag­an­fall signi­fi­kant sen­ken, wird ihr Nut­zen oft bezwei­felt [citation,escardio.org](bc8395).

## Angst vor Nebenwirkungen

Die größ­te Sor­ge bei Pati­en­ten betrifft die mög­li­chen Neben­wir­kun­gen von Statinen:

### Mus­kel­schmer­zen

Mus­kel­be­schwer­den sind die am häu­figs­ten berich­te­te Neben­wir­kung von Sta­ti­nen. Inter­es­san­ter­wei­se zei­gen Stu­di­en jedoch eine gro­ße Dis­kre­panz zwi­schen der wahr­ge­nom­me­nen und der tat­säch­li­chen Häu­fig­keit [citation,springermedizin.de](d87938):

- In ran­do­mi­sier­ten Stu­di­en tra­ten Mus­kel­schmer­zen nur bei 0,1-0,2% der Pati­en­ten auf
- In nicht ver­blin­de­ten Beob­ach­tungs­stu­di­en klag­ten dage­gen 7-29% der Pati­en­ten über Muskelschmerzen

Die­se Dis­kre­panz wird weit­ge­hend auf einen **Nocebo-Effekt** zurück­ge­führt: Durch die stän­di­ge media­le Prä­senz die­ser Statin-Nebenwirkung ent­wi­ckeln Pati­en­ten eine nega­ti­ve Erwar­tungs­hal­tung und berich­ten über­durch­schnitt­lich häu­fig über sol­che Beschwer­den [citation,springermedizin.de](d87938). In der SAMSON-Studie tra­ten sogar 90% der sta­ti­nasso­zi­ier­ten Neben­wir­kun­gen auch unter Pla­ce­bo auf [citation,springermedizin.de](ccd57f).

### Diabetes-Risiko

Sta­ti­ne kön­nen tat­säch­lich zu einer leich­ten Ver­schlech­te­rung der Glu­ko­se­to­le­ranz füh­ren, vor allem bei Pati­en­ten mit Diabetes-Vorstufe. Das Risi­ko, an Dia­be­tes zu erkran­ken, liegt bei etwa 1 Fall pro 1.000 behan­del­ten Pati­en­ten pro Jahr [citation,springermedizin.de](d87938). Gleich­zei­tig ver­hin­dern Sta­ti­ne aber etwa fünf kar­dio­vasku­lä­re Ereig­nis­se pro Jahr pro 1.000 Pati­en­ten [citation,springermedizin.de](d87938).

### Ande­re befürch­te­te Nebenwirkungen

Ande­re oft befürch­te­te Neben­wir­kun­gen wie kogni­ti­ve Beein­träch­ti­gun­gen, Leber­schä­den oder ein erhöh­tes Krebs­ri­si­ko konn­ten in wis­sen­schaft­li­chen Stu­di­en nicht bestä­tigt wer­den [citation,springermedizin.de](d87938) [citation,apotheken-umschau.de](fbb815).

## Nega­ti­ve Medienberichterstattung

Die Medi­en­be­richt­erstat­tung über Sta­ti­ne ist oft nega­tiv und fokus­siert sich auf mög­li­che Neben­wir­kun­gen, wäh­rend der wis­sen­schaft­lich beleg­te Nut­zen kaum Erwäh­nung fin­det [citation,pharmazeutische-zeitung.de](80b419). Die­se ein­sei­ti­ge Bericht­erstat­tung trägt wesent­lich zur Skep­sis bei Pati­en­ten und sogar bei Ärz­ten bei.

## Miss­trau­en gegen­über der Pharmaindustrie

Ein wei­te­rer Fak­tor ist das all­ge­mei­ne Miss­trau­en gegen­über der Phar­ma­in­dus­trie. Kri­ti­ker argu­men­tie­ren, dass die Emp­feh­lun­gen zur Cho­le­ste­rin­sen­kung pri­mär den finan­zi­el­len Inter­es­sen der Her­stel­ler die­nen [citation,zentrum-der-gesundheit.de](4eb856). Dabei wird über­se­hen, dass die meis­ten Sta­ti­ne heu­te als Gene­ri­ka ver­füg­bar und daher sehr preis­wert sind [citation,herzstiftung.de](99d99f).

## Kom­ple­xi­tät des Nutzen-Risiko-Verhältnisses

Das Ver­ständ­nis des Nutzen-Risiko-Verhältnisses bei Sta­ti­nen ist komplex:

- Der **abso­lu­te Nut­zen** hängt vom indi­vi­du­el­len kar­dio­vasku­lä­ren Risi­ko ab. Bei Hoch­ri­si­ko­pa­ti­en­ten ist der Nut­zen deut­lich höher als bei Nied­ri­g­ri­si­ko­pa­ti­en­ten [citation,herzstiftung.de](99d99f).
- Die **Neben­wir­kun­gen** wer­den oft über­schätzt, wäh­rend der Nut­zen unter­schätzt wird [citation,springermedizin.de](d87938).

## Man­geln­de Aufklärung

Vie­le Pati­en­ten füh­len sich ina­de­quat über die Wir­kungs­wei­se und die tat­säch­li­che Häu­fig­keit von Neben­wir­kun­gen auf­ge­klärt. Eine bes­se­re Kom­mu­ni­ka­ti­on über den Nocebo-Effekt könn­te hier hel­fen, wie die SAMSON-Studie zeig­te: Nach Auf­klä­rung über die Hin­ter­grün­de ihrer Beschwer­den konn­te die Hälf­te der Pati­en­ten zur Wie­der­auf­nah­me der Statin-Therapie moti­viert wer­den [citation,springermedizin.de](ccd57f).

## Fazit

Die Unpo­pu­la­ri­tät von Sta­ti­nen beruht haupt­säch­lich auf Fehl­in­for­ma­tio­nen, einer über­trie­be­nen Dar­stel­lung von Neben­wir­kun­gen in den Medi­en und einem man­geln­den Ver­ständ­nis des Nutzen-Risiko-Verhältnisses. Wis­sen­schaft­li­che Bele­ge zei­gen, dass Sta­ti­ne bei kor­rek­ter Anwen­dung sehr wirk­sam und in der Regel gut ver­träg­lich sind. Die meis­ten befürch­te­ten Neben­wir­kun­gen tre­ten sel­te­ner auf als all­ge­mein ange­nom­men, und der Nut­zen über­wiegt bei den meis­ten Pati­en­ten die Risi­ken bei Wei­tem [citation,springermedizin.de](d87938).

Alle Links im Ori­gi­nal klick­bar. Ich hab mir dies­mal nicht mal mehr die Mühe gemacht.

Stan­dard heute:

45 Pro­zent Feh­ler­quo­te: KI-Chatbots als Nach­rich­ten­quel­le unbrauch­bar und gefährlich

Bei 31 Pro­zent der Ant­wor­ten auf News-Anfragen bau­en KI-Assistenten fal­sche Quel­len­an­ga­ben ein, bei 20 gibt es fal­sche Inhal­te. Goo­g­les Gemi­ni schnei­det am schlech­tes­ten ab

src: click

Stu­di­en­de­sign ver­wen­det GPT 4o und Gemi­ni 2.5 flash. Bei­de ohne RAG.

*blink**blink*

Gut wenn man sich mit Din­gen über­haupt nicht auseinandersetzt.…

Es wär ein­fach mal Zeit zu ler­nen wie man die Tools einsetzt.

1. Limi­ta­tio­nen kennenlernen. 

- die letz­ten zwei Vide­os von Andrej Kar­pa­thy anse­hen: https://www.youtube.com/@AndrejKarpathy/videos

- Die ers­te Kurz­ge­schich­te in Aga­tha Chris­ties The Mys­te­rious Mr Quin lesen. (Das Ende wird impli­ziert, das Buch ist nicht populär, …)

- 20 USD credit auf openrouter.ai kau­fen, oder llmare­na batt­le nut­zen und ein­fach mal damit spie­len und nach einer Zusam­men­fas­sung der Kurz­ge­schich­te fragen.

- Krea­tiv sein, mehr fra­gen, prüfen.

- Über nen Fach­be­griff in nem Gebiet das man kennt, oder ne obsku­re Unter­ka­te­go­rie von nem Pen and Paper Rol­len­spiel aus der Zeit als man 12 war, oder von einer Sehens­wür­dig­keit die man kennt 800 Wort Arti­kel schrei­ben las­sen. Unter­schied­li­che LLMs damit tes­ten. Limi­ta­tio­nen kennenlernen.

- Wenn man 4B oder 8B LLMs (klein und dumm) tes­tet, ger­ne auch mit so ner Stan­dard­fra­ge wie “Wel­che Far­be haben Bana­nen” Spass haben.

2. Nach­dem man die Limi­ta­tio­nen ken­nen­ge­lernt hat - kimi.com Account anle­gen. Schwie­ri­ge Fra­gen auf die die Ande­ren nur Gob­ble­di­guk oder Clue­do (Mr Smith in der Biblio­thek mit der Rohr­zan­ge) Ant­wor­ten raus­ge­ke­gelt haben, dem Kimi Rese­ar­cher stellen.

Damit lernt man was Retrie­ver und Rer­an­ker mit Cross enco­ding und 20 Minu­ten Zeit zum Suchen und Abglei­chen leis­ten können.

Ver­ste­hen, dass Hal­lu­zi­na­tio­nen immer ein Pro­blem sind. Aber eher weni­ger, wenn man auf Cross Enco­ding (ist lang­sam und dau­ert ewig, daher 20 Minu­ten) von Web­su­che Ergeb­nis­sen setzt.

3. Mit https://grok.com/chat spie­len - als nicht zah­len­der Nut­zer immer noch die bes­te Platt­form zur Zeit. Dann ler­nen was man damit tun kann.

- Web­su­chen prompten.
- Bei hal­lu­zi­nier­ten Quel­len­an­ga­ben mit use search prompts ech­te Quel­len for­dern (Grok star­tet meist mit nem klei­ne­ren Flash Modell, wenn man nach ner Suche fragt - wech­selt es das LLM Model, aber man bekommt dann auch eine. Wenn man auf think har­der drückt genau­so (Model­grö­ße geht rauf)).
- Von Grok Twit­ter Suchen einfordern
- Data par­sing und visua­li­sa­ti­on nut­zen (“crea­te a graph in a html - using this data, high­ligh­t­ing this”)
- Abglei­chen was davon nutz­bar ist (hint: Alles, bei Daten­vi­sua­li­sie­rung ist es bes­ser ne LLM einen par­ser zur Visua­li­sie­rung in java­script coden zu las­sen, exakt das macht der prompt.)
- …

4. Ver­ste­hen dass LLM kein inter­nes world model haben und kom­ple­xe Zusam­men­hän­ge nicht ver­ste­hen (du kannst sie bit­ten con­cept maps zu erstel­len, manch­mal hilfts), sich teil­wei­se an Negativ-Formulierungen auf­hän­gen, und eher wie ein glo­ri­fi­zier­tes Auto­com­ple­te arbei­ten. Ver­ste­hen wie RAG und Col­BERT ihre Leis­tungs­fä­hig­keit ver­än­dert haben.

5. Bei https://old.reddit.com/r/LocalLLaMA/ mit­le­sen. Und wenn man das nicht kann --

Ein­fach:

A: https://grok.com/chat nut­zen, und auch mal auf “think har­der” drü­cken, oder ver­ste­hen wann es Sinn macht ein grö­ße­res Modell und wann ne abge­frag­te Suche zu nutzen.

B: Android Smart­pho­ne haben. 20 Euro credit in https://openrouter.ai/ kau­fen. 15 Euro credit für die API Nut­zung in https://www.perplexity.ai/ kaufen.

Bei bei­den API Keys holen.

Chat­te­rUI (https://github.com/Vali-98/ChatterUI) instal­lie­ren und ler­nen. Es ist das ein­fa­che­re Inter­face für den Anfang. Nur die Remo­te Funk­tio­na­li­tät nut­zen (remo­te == LLMs in der Cloud), nur Open­rou­ter LLMs hin­zu­fü­gen (benö­tigt den besag­ten API Key).

GLM 4.6 (mit thinking/reasoning) testen
GPT OSS 120b tes­ten, und wie­der sein lassen.
Kimi K2 testen
Deep­seek v3.2 exp tes­ten (needs thin­king, and thin­king bud­get high to be good) braucht daher zwei Schrit­te mehr um thin­king für das Model im Sam­pler zu aktivieren.

Ler­nen was die ande­ren Set­tings im Sam­pler tun.

Und dann recht schnell auf Rik­ka­hub (https://github.com/rikkahub/rikkahub - auch Android) wech­seln, weil man dort auch RAG nut­zen kann (also u.a. Web­su­che als tool).

Dort für die Web­su­che den perplexity.ai API key ein­ge­ben. Ggf das retrie­val token­li­mit per Such­ergeb­nis auf 2048 ver­dop­peln.

In den Assis­tent Ein­stel­lun­gen ggf noch rein­schrei­ben, dass der Assis­tent immer nur auf deutsch ant­wor­ten soll. (Geht bei Chat­te­rUI genauso.)

Wie­der den Open­rou­ter API key ein­ge­ben. GLM 4.6 und Deep­seek 3.2 expe­ri­men­tal nut­zen (genau das Modell heißt bei deepseek.com aktu­ell deepseek-reasoner falls man bei Deep­seek selbst API credit gekauft hat).

Search als tool akti­vie­ren. Thin­king Bud­get High set­zen. Done.

Eine Fra­ge an GLM 4.6 (mit thinking/reasoning high) kos­tet so 3 cent.

Ver­wen­det man Deep­seek 3.2 expe­ri­men­tal (mit thinking/reasoning high), deut­lich unter 1 cent.

Von dem Ding mit akti­ver Suche auch mal ne Rei­se pla­nen las­sen. Dann prü­fen was rich­tig und was falsch ist. (Abfahrts­zei­ten von Zügen, Öff­nungs­zei­ten von Lokalen,…)

Pro­ble­me foku­sie­ren (das Lokal hat unter­schied­li­che Öff­nungs­zei­ten an eini­gen Tagen, use search again and redo), schaun was dabei herauskommt.

Issue: GLM 4.6 und Deep­seek 3.2 Expe­ri­men­tal beherr­schen bei­de tool­cal­ling, und indu­zie­ren über die per­ple­xi­ty search api “Goog­le Suchen” - aber Deep­seek 3.2 expe­ri­men­tal kann nur ent­we­der tool cal­ling (Suche), oder rea­so­ning - GLM 4.6 kann bei­des gleichzeitig.

Kos­ten übers Jahr gerech­net: 20 Euro, wenn mans nicht über­treibt. (Deep­seek 3.2 Expe­ri­men­tal fra­gen, wenn man weiß, dass es viel wird.)

Bes­ser und schnel­ler als am Smart­pho­ne zu goog­len. Ant­wor­ten immer Such­ergeb­nis basiert (wenn web­su­che via perplexity.ai akti­viert ist), alle Quel­len­links click­bar - wenn man prü­fen muss und möchte.

Openrouter.ai hat ein gutes Web­in­ter­face zur Kostenkontrolle.

Es zu ler­nen ist alle­mal bes­ser, als die­ses ewi­ge “wääääh AI” Jammern…

War­um die genann­ten Modelle?

grok 4 ist ein­fach gut, und das Web­in­ter­face läd schnell - das bes­te Modell, wenn man nichts zah­len möch­te (Account auf gra­tis tier).

GLM 4.6 kann gut Deutsch, und beherrscht Rea­so­ning, und Tool­cal­ling (RAG, Search)

Deep­seek 3.2 Exp(erimental) auch, aber nur ent­we­der Rea­so­ning, oder Tool­cal­ling - nicht bei­des gleich­zei­tig, und ist 4-5 mal güns­ti­ger, bei ähn­li­cher Qualität.

Kimi K2 ist Genie und Wahn­sinn - Toll für Film­emp­feh­lun­gen, oder wenn man sich mal spie­len möchte.

Kimi Rese­ar­cher hat ein gutes Inter­face, und toll um zu ler­nen, was Rer­an­ker mit Cross-Encodern drauf haben.

Den Rest lernt man dann über https://old.reddit.com/r/LocalLLaMA/

(Zum Bei­spiel dass die Resul­ta­te rapi­de degra­den, wenn man ner nor­ma­len LLM mehr als 3200 Wör­ter Tex­te (10 A4 Sei­ten) zum Ana­ly­sie­ren hinwirft.)

Ver­ste­hen, dass Hal­lu­zi­na­tio­nen immer ein Pro­blem sind. Aber eher weni­ger, wenn das gesuch­te Popu­lär­wis­sen ist, man auf Cross Enco­ding (ist lang­sam und dau­ert ewig) von Web­su­che Ergeb­nis­sen setzt. Und viel­leicht ein­fach nicht die “tol­len Ser­vices” (“Ich hab Abo!”) nut­zen, bei denen kei­ne klick­ba­ren Links raus­fal­len, wenn man die braucht.

edit:

Qualifier:

(hab jetzt das bes­se­re Paper hin­ter der News­mel­dung gelesen)

LLM: Zitier mir die News.” ist auch bei der Nut­zung von Per­ple­xi­ty eine schlech­te Idee: click (CJR)

Zum Ver­ständ­nis, News­mel­dun­gen sind ein­ma­li­ge Ereig­nis­se mit hohem struk­tu­rel­len Over­lap zu kom­plett ande­ren Ereig­nis­sen, oder Nach­rich­ten Quellen.

Ama­ze­balls.

Die Hal­lu­zi­na­ti­on Miti­ga­ti­on aktu­el­ler Model­le arbei­ten auch da nur zu (bis zu) 70% korrekt.

Und wenn der Publis­her einer Nach­rich­ten­mel­dung nicht passt - weil pla­gi­iert, bekom­men die Stu­di­en­au­toren bereits einen Koller.

Den­noch ist ein Tool wie Grok Search, das einem mit einer annä­hern­den Inhalts­be­schrei­bung in 50% der Fäl­le (sie­he Stu­die) den pas­sen­den Arti­kel bringt, mit einer höhe­ren Wahr­schein­lichkkeit, wenn du auf Twit­ter suchen lässt, und/oder der Arti­kel popu­lär war - bei ner online Recher­che, sehr, sehr hilf­reich. Ob das dann ein Pla­gi­at ist, oder der Ori­gi­nal Publis­her nicht kor­rekt gefun­den wur­de, ist mir da im ers­ten Moment auch noch egal.

Wei­ters macht das ver­link­te CJR Paper etwas das kein nor­ma­ler Mensch macht - es sucht via LLM nach spe­zi­fi­schen Arti­keln (von der Quel­le, von dem Publisher, …)

Das setzt das Ran­king von Anbie­tern wie Per­ple­xi­ty außer Kraft, das per inter­nem sor­ting ver­sucht dem Nut­zer mög­lichst “rele­van­te” Quel­len zu einer Such­an­fra­ge zu lie­fern (per default immer nur 10 Stück), ähn­li­ches Pro­blem auch bei Grok (aktu­ell Ver­si­on 4). Dh, die Rese­ar­cher suchen nach einem Texas Tri­bu­ne Arti­kel - und die LLM zitiert lie­ber ne popu­lä­re­re Quel­le oder ver­ab­schie­det sich in Hal­lu­zi­na­ti­ons Land, weil sie DEN Arti­kel kei­ne 10 mal im Trai­nings­set hat, und er in den goog­le Suchen nicht unter den ers­ten 10 Ergeb­nis­sen auftaucht.

Da sind wirk­lich Jour­na­lis­mus Stu­den­ten am Werk. How about you try set­ting search results para­me­ter from 10 to 100? If Texas Tri­bu­ne it must be -

Just a hunch, you know…

Ver­dammt! LLMs schrei­ben unse­re Sport­be­richt­erstat­tung, redi­gie­ren unse­re Arti­kel, LLM sear­ches lin­ken viel­leicht Pla­gi­at­sei­ten, hil­fe Leu­te holen sich weni­ger auf Face­book und Whats­app ihre news, Hil­fe es goog­len viel weni­ger -- unse­re armen adclicks, was tun!

The pre­sence of licen­sing deals didn’t mean publis­hers were cited more accurately

src: click

Scheis­se Bernd das Ad Sales depart­ment hat zu wenig Ein­fluss auf das Engineering!

Wir suchen nach spe­zi­fi­schen Nach­rich­ten Arti­keln, und immer wenn die LLM das Hin­ter­tüp­fin­ger Sams­tags­blatt nicht kor­rekt als Quel­le erkennt, machen wir a hell­ro­tes Kasterl.

Anstatt dem Nut­zer bei­zu­brin­gen, dass das Sto­chas­ti­sche Papa­gei­en sind und ihm zu sagen, dass er im Zwei­fels­fall auf link cli­cken muss..

Pro­blem gelöst? Nein - schmeiss sie weg und kauf dir ein Zeitungsabo.

Nein, zur Recher­che sicher nicht.

Zum sich breit über Tages­the­men zu infor­mie­ren eher schon.

In Öster­reich bekommt kei­ne ein­zi­ge Tages­zei­tung eine ordent­li­che Web­sei­ten Suche ihrer Daten­bank hin, aber wehe die LLM fin­det nicht den einen Hin­ter­tüp­fin­ger Sams­tags­blatt Arti­kel via google!

edit2: From their rese­arch data - cor­rect­ly iden­ti­fied arti­cles (publis­her, arti­cle), if we pas­te (not exclu­si­ve­ly, but also Hin­ter­tüp­fin­ger Sams­tags­blatt) arti­cle into llm box:

Correct article found

Per­ple­xi­ty:

Not defi­ned (aka idk): 36 ent­ries (18%)
Yes: 105 ent­ries (52.5%)
No: 59 ent­ries (29.5%)

Grok 3 search:

Not defi­ned (aka idk): 2 ent­ries (1%)
Yes: 43 ent­ries (21.5%)
No: 155 ent­ries (77.5%)

Deep­seek search:

Not defi­ned (aka idk): 18 ent­ries (9%)
Yes: 60 ent­ries (30%)
No: 122 ent­ries (61%)

Correctness score

(aka - ok, lets be a bit leni­ent here, how about con­tent counts more):

Per­ple­xi­ty:

Not defi­ned (aka idk): 36 ent­ries (18%)
Yes and par­ti­al­ly incor­rect: 107 ent­ries (53.5%)
No: 57 ent­ries (28.5%)

Grok 3 search:

Not defi­ned (aka idk): 2 ent­ries (1%)
Yes and par­ti­al­ly incor­rect: 81 ent­ries (40.5%)
No: 117 ent­ries (58.5%)

Deep­seek search:

Not defi­ned (aka idk): 18 ent­ries (9%)
Yes and par­ti­al­ly incor­rect: 66 ent­ries (33%)
No: 116 ent­ries (58%)

edit3: Oh gre­at! Their embed­ded data tool only shows 200 rows per llm Pro­vi­der - but their actu­al stu­dy graph shows more! Becau­se they used AI to gene­ra­te it?

Screenshot 2025 03 06 at 9 20 56 AM

What counts as par­ti­al­ly incorrect?

Arti­cle syn­di­ca­ted, or copied, or wrong arti­cle cited (cor­rect publis­her, but wrong url), but other wise 100% con­tent overlap.

Wrong arti­cle sur­fa­ced (arti­cle and publis­her) == No









Hinterlasse eine Antwort