Tech-Giganten wie Apple, Nvidia und Salesforce haben YouTube-Untertitel abgegriffen für das Training der eigenen KI. Die Videoschaffenden wussten nichts davon.
Laut der Github-Seite vom im Artikel erwähnten Skript sind es nur die nicht maschinell generierten Untertitel. Wobei das Skript natürlich nur erkennen kann, ob die Texte von youtube selbst generiert wurden. Wenn die Uploader selbst ihre Videos maschinell transkribiert und diese Untertitel hochgeladen haben, weiß youtube das nicht, und diese Untertitel könnten noch grottiger sein, als die von youtube generierten.
Laut der Github-Seite vom im Artikel erwähnten Skript sind es nur die nicht maschinell generierten Untertitel. Wobei das Skript natürlich nur erkennen kann, ob die Texte von youtube selbst generiert wurden. Wenn die Uploader selbst ihre Videos maschinell transkribiert und diese Untertitel hochgeladen haben, weiß youtube das nicht, und diese Untertitel könnten noch grottiger sein, als die von youtube generierten.