Microsoft Edge Copilot AI ne može sumirati svaki YouTube video
Jedna karakteristika koja je ove nedelje dodata Microsoft-ovom AI Copilot-u u Edge pretraživaču je mogućnost generisanja tekstualnih rezimea video zapisa. Ali funkcija Edge Copilot-a za uštedu vremena je i dalje prilično ograničena i radi samo na prethodno obrađenim video snimcima ili onima sa titlovima, kako je objasnio Mikhail Parakhin, Microsoftov izvršni direktor za oglašavanje i veb usluge.
Kako je primetio MSPowerUser, Parakhin piše: „Da bi to funkcionisalo, moramo prethodno obraditi video. Ako video ima titlove – uvek možemo da se vratimo na to, ako nema i još ga nismo prethodno obradili – onda neće raditi“, u odgovoru na pitanje.
Drugim rečima, sam po sebi Edge Copilot ne sumira toliko video zapise koliko sumira tekstualne transkripte video zapisa. Copilot takođe može da obavlja sličnu funkciju u celom Microsoft 365, uključujući sumiranje timskih video sastanaka i poziva za agente korisničke službe — i u oba slučaja, zvuk prvo treba da transkribuje Microsoft. Copilot na Microsoft Stream-u takođe može da rezimira bilo koji video, ali opet, zahteva od korisnika da generišu pisani transkript.
Razgovor je započeo nakon što je dizajner Pietro Schirano postavio snimak ekrana Edge Copilot koji sumira YouTube video o trejleru za GTA VI. U ovom slučaju, izgledalo je da Copilot savršeno radi svoj posao. Korisnik na snimku pritisne dugme „Generiši video rezime“ na bočnoj traci Copilot-a, a samo nekoliko sekundi kasnije, Copilot izbacuje jedan, zajedno sa istaknutim delovima i vremenskim oznakama.
Naravno, mnoge platforme, uključujući YouTube i Vimeo, mogu automatski da generišu transkripte i titlove – ako korisnici omoguće tu funkciju. Nakon što je The Verge pitao Parakhina na X-u da li možemo pretpostaviti da većina javno dostupnih video zapisa (tj. YouTube) nije prethodno obrađena, on je odgovorio: „Trebalo bi da radi za većinu video snimaka.“
Copilot je samo najnoviji primer generativne AI trke u kojoj se Microsoft takmiči sa Google (i drugima). Prošlog meseca, Google je nadogradio YouTube ekstenziju za svoj Bard chatbot kako bi mu omogućio da rezimira sadržaj video snimka i prikaže specifične informacije iz njega. Samo ove nedelje, Google je najavio veliko ažuriranje za Gemini koje ima svoje probleme – uređivanje kompanije je možda pogrešno predstavilo neke od mogućnosti veštačke inteligencije u demonstraciji, a činjenice nisu uvek jasne.
Parakhin je bio iskren o različitim fazama evolucije Copilota na društvenim medijima. Dok je bio u avionu u utorak ujutro, stručnjak za mašinsko učenje je objavio na X: „Dodavanje mogućnosti za Edge Copilot da koristi informacije u video zapisima – tokom leta.
Izvor: TheVerge