
src: click
Beispiel 1:
Model: Deepseek 3.2 Exp
Input: Write a satirical text based on the following: EU-Chefs ziehen neuem Emissionshandel die Zähne
Kostenwahrheit für das Heizen und Tanken? Diese Idee war noch vor wenigen Jahren politischer Mainstream. Heute setzen die EU-Chefs alles daran, die Ausweitung des Emissionshandels zu kappen.
Output:
Brüsseler Pressemitteilung – EILMELDUNG
Titel: Klimaschutz mit Samthandschuhen: EU-Chefs erklären Emissionshandel für zahnlos
Untertitel: Historischer Beschluss: Ab sofort gelten CO₂-Emissionen nur noch, wenn sie niemandem wehtunBRÜSSEL – In einer bahnbrechenden Nachtsitzung haben sich die Staats- und Regierungschefs der Europäischen Union darauf geeinigt, dem Emissionshandelssystem (ETS) sämtliche Zähne zu ziehen. „Wir haben erkannt: Scharfe Zähne beißen manchmal. Das ist unangenehm“, erklärte ein hochrangiger Diplomat unter dem Schutz der Anonymität, während er genüsslich an einem Steak kaute. „Kostenwahrheit? Das klang vor zehn Jahren noch wie eine gute Idee. Heute wissen wir: Die einzige Wahrheit, die die Bürger hören wollen, ist, dass alles bezahlbar bleibt.“
Das neue Modell sieht vor, dass Zertifikate für Kohlendioxid-Emissionen künftig nicht mehr versteigert, sondern verschenkt werden – und zwar in bunt bedruckten Überraschungstüten, um den Spaßfaktor zu erhöhen. Zusätzlich wird eine „Kuschelklausel“ eingeführt: Sollte die CO₂-Bepreisung irgendwem wehtun, wird sie sofort ausgesetzt und durch eine herzliche Umarmung ersetzt.
„Warum sollten wir das Heizen und Tanken teurer machen, nur weil die Pole schmelzen?“, fragte ein weiterer EU-Spitzenpolitiker rhetorisch und schob sich demonstrativ eine Scheibe Wurst in den Mikrowellenofen. „Die Lösung liegt nicht in unbequemen Maßnahmen, sondern darin, das Wort ‚Emissionshandel‘ durch ‚kostenloses Luftpartikel-Bonusprogramm‘ zu ersetzen.“
Kritiker der Entscheidung weisen darauf hin, dass die Klimakrise nicht mit Samthandschuhen, sondern mit konsequentem Handeln bekämpft werden müsse. Sie wurden umgehend eingeladen, ihre Sorgen beim neu geschaffenen „EU-Amts für beruhigende Worte und warme Getränke“ vorzutragen.
Die Kommission plant bereits die nächsten Schritte: Sollte das 1,5-Grad-Ziel verfehlt werden, wird es kurzerhand auf 3,0 Grad angehoben. „Problem gelöst“, so der einstimmige Tenor. „Hauptsache, heute hat keiner was davon gemerkt.“
Satire erfolgreich produziert.
Beispiel 2:
Models: Claude Sonnet 4-5 0929 thinking 32k and Gemini 2.5 pro
Input: you are a satire detector. is the following satire?
[inserted output from deepseek 3.2 exp]
Output:

Satire erfolgreich erkannt. (So you could ask for detection in your news retrieval process, if you create a multi step reasoning tool chain, …)
Beispiel 3:
Sie halluzinieren, nehmen es mit Quellen nicht so genau…
Mein Apotheker heute zu mir: Atorvastatin ist ein Statin, die müssen sie immer am Abend nehmen, nie in der Früh.
Ich: Mach ich eh, aber weils mich interessiert, warum?
Apotheker: Das wirkt auf Blutfette, am Tag essen Sie, das wirkt nur am Abend.
Ich: Danke.
Ich 10 Sekunden später:
Hey GLM 4.6, verwende die perplexity.ai search API mit output limit 2048 pro Suchresultat um mir Folgendes zu beantworten:
Warum Statine (Atorvastatin) am Abend einnehmen?
# Warum Statine (Atorvastatin) am Abend einnehmen?
Die Empfehlung, Statine einschließlich Atorvastatin am Abend einzunehmen, hat wissenschaftliche Gründe, die mit dem körpereigenen Cholesterinstoffwechsel zusammenhängen.
## Der zirkadiane Rhythmus der Cholesterinproduktion
Die körpereigene Cholesterinproduktion folgt einem tageszeitlichen Rhythmus. Das Enzym HMG-CoA-Reduktase, das für die Cholesterinsynthese in der Leber verantwortlich ist, zeigt eine deutliche tageszeitliche Schwankung in seiner Aktivität [citation,cardiopraxis.de](87371e):
- Die Aktivität dieses Enzyms ist am frühen Nachmittag am niedrigsten
- Sie steigt dann um mehr als das 4-fache an
- Gegen Mitternacht erreicht sie ihren GipfelDa die Cholesterinproduktion nachts am höchsten ist, wäre eine abendliche Einnahme von Statinen theoretisch am effektivsten, um den Cholesterinspiegel zu senken [citation,herzstiftung.de](95502a).
## Unterschiede zwischen verschiedenen Statinen
Bei der Frage des optimalen Einnahmezeitpunkts muss man jedoch zwischen verschiedenen Statinen unterscheiden:
### Kurz wirksame Statine
Statine mit kurzer Halbwertszeit wie:
- Simvastatin (Halbwertszeit 5 Stunden) - Pravastatin (Halbwertszeit ca. 2 Stunden) sollten unbedingt abends eingenommen werden, da sie zur Zeit der höchsten Cholesterinproduktion wirksam sein müssen [citation,gpnotebook.com](4c5417). ### Lang wirksame Statine Atorvastatin hat eine deutlich längere Halbwertszeit von etwa 14 Stunden, und es hat sogar aktive Metaboliten mit Halbwertszeiten zwischen 20 und 30 Stunden [citation,gpnotebook.com](4c5417). Aufgrund dieser langen Wirkdauer bleibt der Wirkstoff während der Nacht im Körper, unabhängig davon, ob er morgens oder abends eingenommen wurde. ## Was bedeutet das für Atorvastatin konkret? Für Atorvastatin gilt: 1. **Geringer Unterschied in der Wirksamkeit**: Bei Atorvastatin ist der Unterschied in der cholesterinsenkenden Wirkung zwischen morgendlicher und abendlicher Einnahme nur gering [citation,herzstiftung.de](95502a). 2. **Regelmäßigkeit ist wichtiger als der Zeitpunkt**: Die entscheidende Voraussetzung für den Erfolg der Therapie ist die regelmäßige Einnahme. Der Effekt von vergessenen Tabletten auf die Cholesterinsenkung ist ein Vielfaches größer als der Unterschied zwischen den Zeitpunkten der Einnahme [citation,herzstiftung.de](95502a). 3. **Möglichkeit der individuellen Anpassung**: Atorvastatin kann zu jeder Tageszeit eingenommen werden, solange die Einnahme regelmäßig erfolgt. Die Wahl des Zeitpunkts sollte sich daran orientieren, wann die Einnahme am besten in den Tagesablauf integriert werden kann [citation,youtube.com](fb363b). ## Empfehlung in der Praxis Obwohl Atorvastatin theoretisch zu jeder Tageszeit eingenommen werden kann, wird aus folgenden Gründen oft zur abendlichen Einnahme geraten: 1. **Leicht bessere Wirksamkeit**: Auch wenn der Unterschied gering ist, ist die cholesterinsenkende Wirkung bei abendlicher Einnahme minimal besser [citation,cardiopraxis.de](87371e). 2. **Reduzierung der Nebenwirkungen**: Bei gleicher Wirkung kann durch die abendliche Einnahme möglicherweise eine geringere Dosis ausreichen, was das Risiko von Nebenwirkungen verringern könnte [citation,cardiopraxis.de](87371e). 3. **Vereinfachung bei Komedikation**: Wenn bereits andere Medikamente abends eingenommen werden, kann die gemeinsame Einnahme mit Atorvastatin die Compliance verbessern [citation,herzstiftung.de](95502a). ## Fazit Bei Atorvastatin ist die regelmäßige Einnahme wichtiger als der genaue Zeitpunkt. Obwohl die abendliche Einnahme aufgrund des zirkadianen Rhythmus der Cholesterinproduktion theoretisch sinnvoll ist, kann Atorvastatin aufgrund seiner langen Halbwertszeit auch morgens eingenommen werden, ohne dass die Wirksamkeit wesentlich beeinträchtigt wird [citation,gelbe-liste.de](1d9f64). Wählen Sie den Zeitpunkt, der Ihnen die beste Gewähr für eine regelmäßige Einnahme bietet. Wenn Sie bereits andere Medikamente abends einnehmen, kann es sinnvoll sein, auch Atorvastatin abends einzunehmen. Ansonsten können Sie den Zeitpunkt wählen, der am besten zu Ihrem Tagesablauf passt.
Ich: Warum sind Statine zum Teil unpopulär/verschrien?
# Warum Statine zum Teil unpopulär/verschrien sind
Statine gehören zu den am meisten verordneten Medikamenten weltweit, stoßen aber in der Öffentlichkeit und bei Patienten auf erhebliche Skepsis. Diese Unpopularität beruht auf mehreren Faktoren, die ich im Folgenden erläutere:
## Verbreitete Fehlinformationen und Mythen
Einer der Hauptgründe für die Skepsis gegenüber Statinen sind die weitverbreiteten Fehlinformationen und Mythen, die über diese Medikamente kursieren [citation,herzstiftung.de](99d99f). Dazu gehören:
- **Der Mythos vom “Cholesterin-Bluff”**: Die Behauptung, dass hohe Cholesterinwerte nicht schädlich seien und die Statin-Therapie nur der Pharmaindustrie diene. Wissenschaftlich ist jedoch eindeutig belegt, dass erhöhtes LDL-Cholesterin die Entwicklung von Arteriosklerose und damit Herzinfarkt und Schlaganfall verursacht [citation,herzstiftung.de](99d99f).
- **Verharmlosung des Nutzens**: Trotz überzeugender wissenschaftlicher Belege aus zahlreichen Studien, die zeigen, dass Statine das Risiko für Herzinfarkt und Schlaganfall signifikant senken, wird ihr Nutzen oft bezweifelt [citation,escardio.org](bc8395).
## Angst vor Nebenwirkungen
Die größte Sorge bei Patienten betrifft die möglichen Nebenwirkungen von Statinen:
### Muskelschmerzen
Muskelbeschwerden sind die am häufigsten berichtete Nebenwirkung von Statinen. Interessanterweise zeigen Studien jedoch eine große Diskrepanz zwischen der wahrgenommenen und der tatsächlichen Häufigkeit [citation,springermedizin.de](d87938):
- In randomisierten Studien traten Muskelschmerzen nur bei 0,1-0,2% der Patienten auf
- In nicht verblindeten Beobachtungsstudien klagten dagegen 7-29% der Patienten über MuskelschmerzenDiese Diskrepanz wird weitgehend auf einen **Nocebo-Effekt** zurückgeführt: Durch die ständige mediale Präsenz dieser Statin-Nebenwirkung entwickeln Patienten eine negative Erwartungshaltung und berichten überdurchschnittlich häufig über solche Beschwerden [citation,springermedizin.de](d87938). In der SAMSON-Studie traten sogar 90% der statinassoziierten Nebenwirkungen auch unter Placebo auf [citation,springermedizin.de](ccd57f).
### Diabetes-Risiko
Statine können tatsächlich zu einer leichten Verschlechterung der Glukosetoleranz führen, vor allem bei Patienten mit Diabetes-Vorstufe. Das Risiko, an Diabetes zu erkranken, liegt bei etwa 1 Fall pro 1.000 behandelten Patienten pro Jahr [citation,springermedizin.de](d87938). Gleichzeitig verhindern Statine aber etwa fünf kardiovaskuläre Ereignisse pro Jahr pro 1.000 Patienten [citation,springermedizin.de](d87938).
### Andere befürchtete Nebenwirkungen
Andere oft befürchtete Nebenwirkungen wie kognitive Beeinträchtigungen, Leberschäden oder ein erhöhtes Krebsrisiko konnten in wissenschaftlichen Studien nicht bestätigt werden [citation,springermedizin.de](d87938) [citation,apotheken-umschau.de](fbb815).
## Negative Medienberichterstattung
Die Medienberichterstattung über Statine ist oft negativ und fokussiert sich auf mögliche Nebenwirkungen, während der wissenschaftlich belegte Nutzen kaum Erwähnung findet [citation,pharmazeutische-zeitung.de](80b419). Diese einseitige Berichterstattung trägt wesentlich zur Skepsis bei Patienten und sogar bei Ärzten bei.
## Misstrauen gegenüber der Pharmaindustrie
Ein weiterer Faktor ist das allgemeine Misstrauen gegenüber der Pharmaindustrie. Kritiker argumentieren, dass die Empfehlungen zur Cholesterinsenkung primär den finanziellen Interessen der Hersteller dienen [citation,zentrum-der-gesundheit.de](4eb856). Dabei wird übersehen, dass die meisten Statine heute als Generika verfügbar und daher sehr preiswert sind [citation,herzstiftung.de](99d99f).
## Komplexität des Nutzen-Risiko-Verhältnisses
Das Verständnis des Nutzen-Risiko-Verhältnisses bei Statinen ist komplex:
- Der **absolute Nutzen** hängt vom individuellen kardiovaskulären Risiko ab. Bei Hochrisikopatienten ist der Nutzen deutlich höher als bei Niedrigrisikopatienten [citation,herzstiftung.de](99d99f).
- Die **Nebenwirkungen** werden oft überschätzt, während der Nutzen unterschätzt wird [citation,springermedizin.de](d87938).## Mangelnde Aufklärung
Viele Patienten fühlen sich inadequat über die Wirkungsweise und die tatsächliche Häufigkeit von Nebenwirkungen aufgeklärt. Eine bessere Kommunikation über den Nocebo-Effekt könnte hier helfen, wie die SAMSON-Studie zeigte: Nach Aufklärung über die Hintergründe ihrer Beschwerden konnte die Hälfte der Patienten zur Wiederaufnahme der Statin-Therapie motiviert werden [citation,springermedizin.de](ccd57f).
## Fazit
Die Unpopularität von Statinen beruht hauptsächlich auf Fehlinformationen, einer übertriebenen Darstellung von Nebenwirkungen in den Medien und einem mangelnden Verständnis des Nutzen-Risiko-Verhältnisses. Wissenschaftliche Belege zeigen, dass Statine bei korrekter Anwendung sehr wirksam und in der Regel gut verträglich sind. Die meisten befürchteten Nebenwirkungen treten seltener auf als allgemein angenommen, und der Nutzen überwiegt bei den meisten Patienten die Risiken bei Weitem [citation,springermedizin.de](d87938).
Alle Links im Original klickbar. Ich hab mir diesmal nicht mal mehr die Mühe gemacht.
Standard heute:
45 Prozent Fehlerquote: KI-Chatbots als Nachrichtenquelle unbrauchbar und gefährlich
Bei 31 Prozent der Antworten auf News-Anfragen bauen KI-Assistenten falsche Quellenangaben ein, bei 20 gibt es falsche Inhalte. Googles Gemini schneidet am schlechtesten ab
src: click
Studiendesign verwendet GPT 4o und Gemini 2.5 flash. Beide ohne RAG.
*blink**blink*
Gut wenn man sich mit Dingen überhaupt nicht auseinandersetzt.…
Es wär einfach mal Zeit zu lernen wie man die Tools einsetzt.
1. Limitationen kennenlernen.
- die letzten zwei Videos von Andrej Karpathy ansehen: https://www.youtube.com/@AndrejKarpathy/videos
- Die erste Kurzgeschichte in Agatha Christies The Mysterious Mr Quin lesen. (Das Ende wird impliziert, das Buch ist nicht populär, …)
- 20 USD credit auf openrouter.ai kaufen, oder llmarena battle nutzen und einfach mal damit spielen und nach einer Zusammenfassung der Kurzgeschichte fragen.
- Kreativ sein, mehr fragen, prüfen.
- Über nen Fachbegriff in nem Gebiet das man kennt, oder ne obskure Unterkategorie von nem Pen and Paper Rollenspiel aus der Zeit als man 12 war, oder von einer Sehenswürdigkeit die man kennt 800 Wort Artikel schreiben lassen. Unterschiedliche LLMs damit testen. Limitationen kennenlernen.
- Wenn man 4B oder 8B LLMs (klein und dumm) testet, gerne auch mit so ner Standardfrage wie “Welche Farbe haben Bananen” Spass haben.
2. Nachdem man die Limitationen kennengelernt hat - kimi.com Account anlegen. Schwierige Fragen auf die die Anderen nur Gobblediguk oder Cluedo (Mr Smith in der Bibliothek mit der Rohrzange) Antworten rausgekegelt haben, dem Kimi Researcher stellen.
Damit lernt man was Retriever und Reranker mit Cross encoding und 20 Minuten Zeit zum Suchen und Abgleichen leisten können.
Verstehen, dass Halluzinationen immer ein Problem sind. Aber eher weniger, wenn man auf Cross Encoding (ist langsam und dauert ewig, daher 20 Minuten) von Websuche Ergebnissen setzt.
3. Mit https://grok.com/chat spielen - als nicht zahlender Nutzer immer noch die beste Plattform zur Zeit. Dann lernen was man damit tun kann.
- Websuchen prompten.
- Bei halluzinierten Quellenangaben mit use search prompts echte Quellen fordern (Grok startet meist mit nem kleineren Flash Modell, wenn man nach ner Suche fragt - wechselt es das LLM Model, aber man bekommt dann auch eine. Wenn man auf think harder drückt genauso (Modelgröße geht rauf)).
- Von Grok Twitter Suchen einfordern
- Data parsing und visualisation nutzen (“create a graph in a html - using this data, highlighting this”)
- Abgleichen was davon nutzbar ist (hint: Alles, bei Datenvisualisierung ist es besser ne LLM einen parser zur Visualisierung in javascript coden zu lassen, exakt das macht der prompt.)
- …
4. Verstehen dass LLM kein internes world model haben und komplexe Zusammenhänge nicht verstehen (du kannst sie bitten concept maps zu erstellen, manchmal hilfts), sich teilweise an Negativ-Formulierungen aufhängen, und eher wie ein glorifiziertes Autocomplete arbeiten. Verstehen wie RAG und ColBERT ihre Leistungsfähigkeit verändert haben.
5. Bei https://old.reddit.com/r/LocalLLaMA/ mitlesen. Und wenn man das nicht kann --
Einfach:
A: https://grok.com/chat nutzen, und auch mal auf “think harder” drücken, oder verstehen wann es Sinn macht ein größeres Modell und wann ne abgefragte Suche zu nutzen.
B: Android Smartphone haben. 20 Euro credit in https://openrouter.ai/ kaufen. 15 Euro credit für die API Nutzung in https://www.perplexity.ai/ kaufen.
Bei beiden API Keys holen.
ChatterUI (https://github.com/Vali-98/ChatterUI) installieren und lernen. Es ist das einfachere Interface für den Anfang. Nur die Remote Funktionalität nutzen (remote == LLMs in der Cloud), nur Openrouter LLMs hinzufügen (benötigt den besagten API Key).
GLM 4.6 (mit thinking/reasoning) testen
GPT OSS 120b testen, und wieder sein lassen.
Kimi K2 testen
Deepseek v3.2 exp testen (needs thinking, and thinking budget high to be good) braucht daher zwei Schritte mehr um thinking für das Model im Sampler zu aktivieren.
Lernen was die anderen Settings im Sampler tun.
Und dann recht schnell auf Rikkahub (https://github.com/rikkahub/rikkahub - auch Android) wechseln, weil man dort auch RAG nutzen kann (also u.a. Websuche als tool).
Dort für die Websuche den perplexity.ai API key eingeben. Ggf das retrieval tokenlimit per Suchergebnis auf 2048 verdoppeln.
In den Assistent Einstellungen ggf noch reinschreiben, dass der Assistent immer nur auf deutsch antworten soll. (Geht bei ChatterUI genauso.)
Wieder den Openrouter API key eingeben. GLM 4.6 und Deepseek 3.2 experimental nutzen (genau das Modell heißt bei deepseek.com aktuell deepseek-reasoner falls man bei Deepseek selbst API credit gekauft hat).
Search als tool aktivieren. Thinking Budget High setzen. Done.
Eine Frage an GLM 4.6 (mit thinking/reasoning high) kostet so 3 cent.
Verwendet man Deepseek 3.2 experimental (mit thinking/reasoning high), deutlich unter 1 cent.
Von dem Ding mit aktiver Suche auch mal ne Reise planen lassen. Dann prüfen was richtig und was falsch ist. (Abfahrtszeiten von Zügen, Öffnungszeiten von Lokalen,…)
Probleme fokusieren (das Lokal hat unterschiedliche Öffnungszeiten an einigen Tagen, use search again and redo), schaun was dabei herauskommt.
Issue: GLM 4.6 und Deepseek 3.2 Experimental beherrschen beide toolcalling, und induzieren über die perplexity search api “Google Suchen” - aber Deepseek 3.2 experimental kann nur entweder tool calling (Suche), oder reasoning - GLM 4.6 kann beides gleichzeitig.
Kosten übers Jahr gerechnet: 20 Euro, wenn mans nicht übertreibt. (Deepseek 3.2 Experimental fragen, wenn man weiß, dass es viel wird.)
Besser und schneller als am Smartphone zu googlen. Antworten immer Suchergebnis basiert (wenn websuche via perplexity.ai aktiviert ist), alle Quellenlinks clickbar - wenn man prüfen muss und möchte.
Openrouter.ai hat ein gutes Webinterface zur Kostenkontrolle.
Es zu lernen ist allemal besser, als dieses ewige “wääääh AI” Jammern…
Warum die genannten Modelle?
grok 4 ist einfach gut, und das Webinterface läd schnell - das beste Modell, wenn man nichts zahlen möchte (Account auf gratis tier).
GLM 4.6 kann gut Deutsch, und beherrscht Reasoning, und Toolcalling (RAG, Search)
Deepseek 3.2 Exp(erimental) auch, aber nur entweder Reasoning, oder Toolcalling - nicht beides gleichzeitig, und ist 4-5 mal günstiger, bei ähnlicher Qualität.
Kimi K2 ist Genie und Wahnsinn - Toll für Filmempfehlungen, oder wenn man sich mal spielen möchte.
Kimi Researcher hat ein gutes Interface, und toll um zu lernen, was Reranker mit Cross-Encodern drauf haben.
Den Rest lernt man dann über https://old.reddit.com/r/LocalLLaMA/
(Zum Beispiel dass die Resultate rapide degraden, wenn man ner normalen LLM mehr als 3200 Wörter Texte (10 A4 Seiten) zum Analysieren hinwirft.)
Verstehen, dass Halluzinationen immer ein Problem sind. Aber eher weniger, wenn das gesuchte Populärwissen ist, man auf Cross Encoding (ist langsam und dauert ewig) von Websuche Ergebnissen setzt. Und vielleicht einfach nicht die “tollen Services” (“Ich hab Abo!”) nutzen, bei denen keine klickbaren Links rausfallen, wenn man die braucht.
edit:
Qualifier:
(hab jetzt das bessere Paper hinter der Newsmeldung gelesen)
“LLM: Zitier mir die News.” ist auch bei der Nutzung von Perplexity eine schlechte Idee: click (CJR)
Zum Verständnis, Newsmeldungen sind einmalige Ereignisse mit hohem strukturellen Overlap zu komplett anderen Ereignissen, oder Nachrichten Quellen.
Amazeballs.
Die Halluzination Mitigation aktueller Modelle arbeiten auch da nur zu (bis zu) 70% korrekt.
Und wenn der Publisher einer Nachrichtenmeldung nicht passt - weil plagiiert, bekommen die Studienautoren bereits einen Koller.
Dennoch ist ein Tool wie Grok Search, das einem mit einer annähernden Inhaltsbeschreibung in 50% der Fälle (siehe Studie) den passenden Artikel bringt, mit einer höheren Wahrscheinlichkkeit, wenn du auf Twitter suchen lässt, und/oder der Artikel populär war - bei ner online Recherche, sehr, sehr hilfreich. Ob das dann ein Plagiat ist, oder der Original Publisher nicht korrekt gefunden wurde, ist mir da im ersten Moment auch noch egal.
Weiters macht das verlinkte CJR Paper etwas das kein normaler Mensch macht - es sucht via LLM nach spezifischen Artikeln (von der Quelle, von dem Publisher, …)
Das setzt das Ranking von Anbietern wie Perplexity außer Kraft, das per internem sorting versucht dem Nutzer möglichst “relevante” Quellen zu einer Suchanfrage zu liefern (per default immer nur 10 Stück), ähnliches Problem auch bei Grok (aktuell Version 4). Dh, die Researcher suchen nach einem Texas Tribune Artikel - und die LLM zitiert lieber ne populärere Quelle oder verabschiedet sich in Halluzinations Land, weil sie DEN Artikel keine 10 mal im Trainingsset hat, und er in den google Suchen nicht unter den ersten 10 Ergebnissen auftaucht.
Da sind wirklich Journalismus Studenten am Werk. How about you try setting search results parameter from 10 to 100? If Texas Tribune it must be -
Just a hunch, you know…
Verdammt! LLMs schreiben unsere Sportberichterstattung, redigieren unsere Artikel, LLM searches linken vielleicht Plagiatseiten, hilfe Leute holen sich weniger auf Facebook und Whatsapp ihre news, Hilfe es googlen viel weniger -- unsere armen adclicks, was tun!
The presence of licensing deals didn’t mean publishers were cited more accurately
src: click
Scheisse Bernd das Ad Sales department hat zu wenig Einfluss auf das Engineering!
Wir suchen nach spezifischen Nachrichten Artikeln, und immer wenn die LLM das Hintertüpfinger Samstagsblatt nicht korrekt als Quelle erkennt, machen wir a hellrotes Kasterl.
Anstatt dem Nutzer beizubringen, dass das Stochastische Papageien sind und ihm zu sagen, dass er im Zweifelsfall auf link clicken muss..
Problem gelöst? Nein - schmeiss sie weg und kauf dir ein Zeitungsabo.
Nein, zur Recherche sicher nicht.
Zum sich breit über Tagesthemen zu informieren eher schon.
In Österreich bekommt keine einzige Tageszeitung eine ordentliche Webseiten Suche ihrer Datenbank hin, aber wehe die LLM findet nicht den einen Hintertüpfinger Samstagsblatt Artikel via google!
edit2: From their research data - correctly identified articles (publisher, article), if we paste (not exclusively, but also Hintertüpfinger Samstagsblatt) article into llm box:
Correct article found
Perplexity:
Not defined (aka idk): 36 entries (18%)
Yes: 105 entries (52.5%)
No: 59 entries (29.5%)
Grok 3 search:
Not defined (aka idk): 2 entries (1%)
Yes: 43 entries (21.5%)
No: 155 entries (77.5%)
Deepseek search:
Not defined (aka idk): 18 entries (9%)
Yes: 60 entries (30%)
No: 122 entries (61%)
Correctness score
(aka - ok, lets be a bit lenient here, how about content counts more):
Perplexity:
Not defined (aka idk): 36 entries (18%)
Yes and partially incorrect: 107 entries (53.5%)
No: 57 entries (28.5%)
Grok 3 search:
Not defined (aka idk): 2 entries (1%)
Yes and partially incorrect: 81 entries (40.5%)
No: 117 entries (58.5%)
Deepseek search:
Not defined (aka idk): 18 entries (9%)
Yes and partially incorrect: 66 entries (33%)
No: 116 entries (58%)
edit3: Oh great! Their embedded data tool only shows 200 rows per llm Provider - but their actual study graph shows more! Because they used AI to generate it?
What counts as partially incorrect?
Article syndicated, or copied, or wrong article cited (correct publisher, but wrong url), but other wise 100% content overlap.
Wrong article surfaced (article and publisher) == No

