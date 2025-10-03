Wikipedia je najavila novu bazu podataka koja će bogato znanje Wikipedie učiniti pristupačnim modelima AI.

Wikipedia u Nemačkoj započinje projekat koji će podatke ove platforme učiniti dostupnijim modelima veštačke inteligencije. Projekat podrazumeva primenu vektorske semantičke pretrage koja pomaže računarima da razumeju značenje i odnose između reči na već postojeće podatke koje Wikipedia ima. Baza podataka ima preko 120 miliona unosa.

U kombinaciji sa novom podrškom za Protokol konteksta modela uspostavlja se standard koji pomaže sistemima veštačke inteligencije da komuniciraju sa izvorima podataka, a sami podaci postaju pristupačniji upitima prirodnog jezika.

Projekat se realizuje u Nemačkoj u saradnji sa kompanijama za neuronsko pretraživanje Jina.AI i DataStax koje su u vlasništvu IBM.

Podaci su u okviru ovog projekta strukturirani tako da pružaju ključni semantički kontekst. Cilj projekta je da dođe do bržeg i jednostavnijeg umrežavanja podataka prema realnoj potrebi korisnika.

Ovaj projekat dolazi u momentu kada programeri AI pokšavaju da srede baze podataka i da ih učine pouzdanijim. Sistemi za obuku jesu postali sofisticiraniji ali se čini da struktura podataka ne može da ih prati, samim tim dobijene baze nisu pouzdane. Takvo stanje značajno otežava primenu AI u širem smislu.

Izvor: techcrunch.com