Atpakaļ

OpenAI: Dati internetā var beigties jau pēc diviem gadiem

Jaunākais ziņojums no tehnoloģiju frontes 2024. gadā atklāj, ka internets teju izsīcis no kvalitatīviem datiem, ko izmantot mākslīgā intelekta trenēšanai. Lielie tehnoloģiju uzņēmumi, tādi kā OpenAI, saskaras ar augstas kvalitātes datu trūkumu, tādiem kā Wikipēdijas ieraksti vai zinātniski raksti, un brīdina, ka tie varētu pilnībā beigties tuvāko divu gadu laikā.

Lai apmierinātu savas vajadzības, uzņēmumi izstrādā jaunas, dažkārt juridiski apšaubāmas metodes datu ieguvei, piemēram, attīstot rīkus, kas pārraksta audio no YouTube video.

Google, kas pieder YouTube, ir kluss par šo praksi, iespējams, tāpēc, ka pats piedalās līdzīgās aktivitātēs. Meta pat apsvērusi izdevniecības Simon & Schuster iegādi, lai piekļūtu tās grāmatu saturam.

Šī ir jauna, dīvaina realitāte tehnoloģiju pasaulē, kur datu trūkums pārveido ne tikai AI attīstību, bet arī intelektuālā īpašuma robežas.