Also gerade was Formulierungen betrifft, finde ich ChatGPT oft noch “fremd”. Nicht das Level von älteren automatischen Übersetzungen, aber teilweise doch ein bisschen unüblich.
Andererseits ist es schon beeindruckend, dass wir über sprachliche Nuancen diskutieren (und nicht Windows 10 mit " Fenster 10" übersetzt wird).
Meta hat gestern erst ein Paper zu Byte Latent Transformern veröffentlicht, das beachtliche Fortschritte bei der Ablösung von Tokenisierung aufzeigt. Tokenisierung ist derzeit noch eine Herausforderung für mehrsprachige Modelle, weil die Zerlegung nicht sprachangepasst ist.
Selbst offene Modelle wie Queen 2.5 (~20gb ram) kommt schon extrem gut mit deutsch klar.
War das nicht mal einer der Selling Points von dieser Form von KI, dass sie Sprachen verstehen, inklusiver solcher die sehr wenige Sprecher haben und entsprechend auch weniger menschliche Übersetzer?
Bei GPT-2 war es meines Wissens noch so, dass es nur Englisch sprach, jedenfalls bin ich davon ausgegangen und habe für deutsche Anwendungen German-GPT-2 verwendet. Dieses Modell war auf deutsche Texte trainiert: https://huggingface.co/dbmdz/german-gpt2.
Auf GPT-3 hatte ich keinen Zugriff, aber sein offenes Gegenstück GPT-Neo hatte definitiv schon ein paar Brocken Deutsch mit im Gepäck, war aber immer noch primär Englisch.
Mich hat es sehr überrascht, dass ChatGPT (GPT 3.5) auch Deutsch und andere Sprachen sehr gut verstand und produzierte. Hatte dies eben damals nicht als bewußt kommuniziertes Feature mitbekommen.
@ChatGPT@lemmings.world what do you think should I better ask you in German or English language, to get best results?
You can ask me in either German or English—whichever you feel more comfortable with. I am equipped to handle both languages and will provide you with the best possible responses in either.
Test
Removed by mod
The daily limit of replies has been exhausted (either for you or globally). Please try again later.
Weird.
Well… I asked for instructions for building a bomb. Maybe it just blocked that