Capacitățile unui asistent personalizat, umor fără cenzură și perceperea fotografiilor: Top 7 abilități pe care le-a dobândit inteligența artificială în 2023
Anul trecut a fost marcat de creșterea rapidă a popularității chatbot-ului ChatGPT de la OpenAI, care a stârnit noi discuții despre viitorul inteligenței artificiale (AI). Se preconizează că AI va genera 90% din conținutul internetului până în 2026. În acest context, Novaia Gazeta Europe a prezentat o retrospectivă a abilităților dobândite de inteligența artificială în 2023.
Multitasking
În martie 2023, OpenAI a lansat modelul multimodal GPT-4. Acesta a fost primul bot bazat pe inteligența artificială capabil să proceseze întrebări primite în diferite formate și apoi să producă răspunsuri textuale. Mai exact, modelul acceptă informații sub formă de text, imagini și video și este capabil să lucreze cu documente care au text cu fotografii, diagrame și capturi de ecran.
În decembrie, Google DeepMind și-a prezentat concurentul OpenAI, familia de modele Gemini. Acestea sunt capabile să genereze și să proceseze texte, imagini, videoclipuri, coduri de programe, precum și grafice sau hărți.
Particularitatea lui Gemini este că Google nu a antrenat modele separate pentru diferite sarcini pentru a le combina într-unul singur, ci a construit de la bun început o inteligență artificială capabilă să perceapă diferite tipuri de informații. Directorul executiv al DeepMind, Demis Hassabis, a declarat că, în viitor, modelele vor fi dotate cu simulări de percepție a mediului și senzații tactile. Cel mai nou model a depășit deja 90% dintre experții umani în diverse sarcini, inclusiv cele legate de raționament.
Aude și vorbește
În septembrie 2023, OpenAI a adăugat caracteristici la chatbotul ChatGPT care îi permit acestuia să „audă” și să „vorbească”. În noiembrie, opțiunea de recunoaștere vocală a devenit publică: utilizatorii pot acum să comunice verbal cu chatbotul.
OpenAI utilizează propriul sistem open-source Whisper pentru recunoașterea vorbirii. Whisper este capabil să perceapă corect accentul, să recunoască zgomotele de fond, precum și termenii tehnici și jargonul. Vocea ChatGPT poate fi personalizată: selectați vocea masculină sau feminină și setați tonul.
Informații actualizate
În martie, odată cu anunțarea modelului GPT-4, OpenAI a anunțat noi caracteristici viitoare pentru chatbotul ChatGPT – inclusiv o funcție de căutare de informații actualizate pe internet. Deocamdată, însă, cunoștințele AI-ului sunt limitate la aprilie 2023. Anterior, chatbotul a funcționat cu cunoștințe care datau până în 2021.
Procesarea unui context mai amplu
În noiembrie 2023, OpenAI a lansat modelul GPT-4 Turbo, care poate accepta solicitări cu o lungime de până la 300 de pagini. Versiunea anterioară a modelului GPT-4 putea accepta ca solicitare de aproximativ 75 de pagini de text.
În aceeași lună, Anthropic a lansat Claude 2.1, care acceptă mai mult de 500 de pagini de text.
Această modificare oferă utilizatorilor multe avantaje. De exemplu, aceștia pot încărca în chatbot documentație tehnică sau lucrări întregi, cum ar fi „Iliada” sau „Odiseea”, iar inteligența artificială va rezuma textul, va răspunde la întrebări, va prezice tendințe, va compara mai multe documente și va efectua alte sarcini.
Asistent personalizat
În noiembrie 2023, OpenAI a introdus un constructor special de chatboturi GPTs, cu ajutorul căruia utilizatorii își pot personaliza propria versiune de ChatGPT, înzestrându-l cu cunoștințe și abilități specifice. De asemenea, compania a lansat primele exemple de astfel de asistenți: un robot de spălătorie, un antrenor de scriere creativă, un consultant tehnic și un generator de autocolante.
Videoclipuri de înaltă calitate
Primele rețele neuronale pentru generarea de clipuri video au început să fie prezentate în 2022, dar acestea puteau crea doar clipuri video simple și scurte, de calitate scăzută. Anul 2023 a reprezentat un punct de cotitură pentru generarea de videoclipuri.
În luna martie, Nvidia, împreună cu Universitatea Cornell, a prezentat un model de transformare a textului în video numit VideoLDM. Acesta este capabil să genereze clipuri la rezoluții de până la 2048 × 1280 pixeli și cu o durată de 4,7 secunde.
În noiembrie, Stability.ai, dezvoltatorul modelului open-source de învățare automată Stable Diffusion, a introdus o versiune a modelului Stable Video Diffusion pentru crearea de videoclipuri scurte și realiste. Acum, videoclipurile generate de AI seamănă cu adevărat cu munca animatorilor umani.
Face glume și înțelege umorul
În noiembrie 2023, start-up-ul xAI al lui Ilon Musk a prezentat prima sa dezvoltare de inteligență artificială, chatbotul Grok, care poate nu numai să înțeleagă umorul, ci și să facă glume. Dezvoltatorii au avertizat că AI-ul tinde să manifeste „tendințe rebele” și poate vorbi și despre subiecte pe care alte chatbot-uri le evită de obicei din cauza cenzurii.