Sun'iy Intellekt
Platonik SI: barcha sunʼiy intellektlar bir xilmi?
Maʼlumotlarga atroflicha nazar
Bir necha kun oldin sunʼiy intellekt va falsafani birlashtiruvchi nazariyaga duch keldim: barcha neyrotarmoqlar bir xilmi? Boshqacha qilib aytganda, kelajakdagi barcha sunʼiy intellekt modellari bir xil boʻladimi?
Aslida tadqiqotchilar bu jarayon allaqachon boshlangani haqida aniq dalillarga ega. Chunki barcha sunʼiy modellar “Platonik” tasvirga birlashib borayotgandek tuyuladi.
Dunyoni tushunishning noyob usuli
Agar bu toʻgʻri boʻlsa, iqtisod va falsafaga aloqador yoqimsiz oqibatlar juda katta boʻlar edi. Chunki SI asos modellari tufayli o‘zi voqelikni ochishni, tushuntirishni va bashorat qilishni boshlaganiga ishora qilishi mumkin.
Tasvirlar
Tadqiqotchilar nega bu savolni berayotganini tushunish uchun modellarning dunyoni qanday talqin qilishini tushunishimiz kerak.
Bu esa tasvirlar orqali amalga oshiriladi.
SIdagi eng muhim soʻz:
Oʻrganadigan dunyosining har bir tushunchasi uchun SI modellari reprezentatsiya – oʻziga xos muhim sifatlarni tasvirlashning qisqa usulini hosil qiladi.
Xususan, SI modellari har bir tushunchani vektor koʻrinishidagi shaklga keltiradi.
Lekin nega aynan vektorlar? Xoʻsh, agar dunyodagi hamma narsa vektorga aylansa, biz ikkita narsaga ega boʻlamiz:
Raqamli tushunchalar. Mashinalar faqat raqamlarni talqin qila oladi. Shuning uchun hamma narsa qandaydir tarzda raqamli shaklga keltirilishi kerak.
Oʻxshashlik: hamma narsani vektor sifatida olish orqali ular orasidagi masofani oʻlchashimiz mumkin:
Shunday qilib, SI variantlari modelning dunyo haqidagi anglashlarini tasvirlaydigan tushunchalarining koʻp oʻlchamli (har bir vektor uchun koʻp sonli) makonini yaratadi. Bu makon OpenAI tomonidan belgilangan bogʻliqlik tamoyili orqali boshqariladi:
Ushbu ichki olamda 2 ta haqiqiy dunyo tushunchalari bir-biriga qanchalik oʻxshash boʻlsa, vektorlari ham shunchalik yaqin boʻladi.
Masalan, ushbu makonda “it” va “mushuk” tushunchalari “it” va “deraza”dan koʻra oʻzaro yaqin. “It” va “kabutar”dan ham yaqinroq. Chunki “it” va “mushuk” maʼnoviy jihatdan koʻproq oʻxshashlikka (masalan, yerda harakatlanadi, 4 oyoqli va uy hayvoni) ega.
Lekin ular bu makonni qanday yaratadi?
“It” va “mushuk” misolidan foydalanib, millionlab matnlar koʻrib chiqiladi. Bu orqali model “it” va “mushuk” soʻzlari insoniyat tilida oʻxshash vaziyatlarda ishlatilishini anglab yetadi. Shu tariqa bu oʻxshashlik haqida qaror qabul qiladi.
Ajablanarli tarafi shundaki, yashirin makonlar (bular shunday ataladi) ikkita yoʻnalishda ishlaydi. Ular nafaqat sunʼiy intellekt modellariga dunyo tushunchalarini qanday oʻrgatishimizga yordam beradi. Balki odamlar hali oʻzi tushunib yetmagan dunyo shakllarini kashf qilishiga koʻmaklashadi.
Masalan:
Yashirin makonlar ortidagi semantik makon nazariyasi (Semantic Space Theory) inson emotsiyalarining yangi toʻplamini kashf qilishimizda yordam beryapti, xuddi Hume.ai isbotlaganidek.
Osmo.ai boshchiligidagi tadqiqot bilan dunyodagi hidlarni xaritalash va navbatdagilarini topish uchun interpolyatsiya qilish orqali yangilarini kashf qilmoqdamiz.
HumeAIʼning yuz ifodalarini xaritalashi
Lekin qanday qilib?
Maʼlum boʻlishicha, SI namunalarni moslashtirishda odamlardan yaxshiroqdir. SI dastlab bizga nomaʼlum boʻlgan yoki tan olish juda noxolis boʻlgan maʼlumotlardan asosiy andozalarni topadi. (SI Gʻarb madaniyati va boshqalar oʻrtasida koʻprik vazifasini bajarishi mumkin. Masalan, Gʻarb boʻlmagan mamlakatlardagi odamlar baʼzi his-tuygʻularni boshqacha ifodalaydi.)
Demak, agar SI haqiqatan ham voqelikni “xolis” ko‘rishga qodir bo‘lsa, ular voqelikni qanday bo‘lsa, shundayligicha kuzatishga qodirmi?
Tadqiqotchilar gipotezasiga koʻra javob “ha”.
Gʻor allegoriyasi (Aflotun)
Sunʼiy intellekt har bir kuzatish va hodisani keltirib chiqaradigan voqelikning haqiqiy mohiyatini oʻrgana oladimi?
Farqlar ahamiyati
Mabodo shunday boʻlsa, oxir-oqibatda biz sunʼiy intellekt boʻyicha mashgʻulotlarimizni shu qadar takomillashtiramizki, SI asos modellari hammasi bir xil boʻladi. Chunki voqelikni qanday boʻlsa, shundayligicha talqin qilishning bitta toʻgʻri yoʻli bor xolos. Shunday emasmi?
Ushbu nazariyani tasdiqlash uchun tadqiqotchilar modellarning tasavvurlari dunyoning yagona tasviriga, obyektiv ravishda haqiqiy va universal voqelikni ifodalash usuliga birlashishi kerakligini taʼkidladi.
Tasvir yaratishni intellektning faoliyati sifatida tasavvur qiling. Dunyoni qanchalik yaxshi tushunsa, buning isboti sifatida uni shunchalik yaxshi tasvirlaydi.
Lekin amalda shunday boʻlyaptimi, yoʻqmi, buni qanday aniqlaymiz? Buni bilish uchun tadqiqotchilar bir qancha mashhur modellarning yashirin makonlarini solishtirib koʻrdi.
Agar eslaydigan boʻlsak, yuqorida aytib oʻtilganidek, SI yaratgan dunyo tasviri oʻxshash narsalar bir-biriga yaqinroq boʻlgan va nooʻxshash tushunchalar uzoqlashtirilgan yuqori oʻlchamli makondir (avvalgi diagrammalarda tushunarli boʻlishi uchun uch oʻlchamda koʻrsatilgan).
Biroq nafaqat tushuncha tasvirlarining umumiy tarqalishi, balki ularning orasidagi farqlar ham muhimdir.
Yaʼni modelning “qizil” rangga belgilangan tasviri nafaqat bir xil uslubdagi (LLMʼlarni qiyoslang) boshqa namunalarga oʻxshash boʻlishi kerak. Balki Language Model va Vision Model “qizil”ni qanday talqin qilishi – kodlashi ham unga oʻxshashligi talab etiladi.
Oddiy qilib aytganda, ular qizil rangni real voqelik qanday tasvirlasa, shundayligicha talqin qiladi. “Qizil” va “koʻk” oʻrtasidagi farq modellar orasida bir xil boʻlishi kerak. Shunday qilib, biz ikkala model ham bir xil “qizil” tushunchasiga yaqinlashayotganini isbotlaymiz.
Platonik tasvir nazariyasi “Haqiqat tomoshabinning koʻziga bogʻliq emas, balki u universaldir” degan maʼnoni anglatadi.
Lekin nega biz uni Platonik tasvir deb ataymiz?
Voqelikning qisman aks ettirilishi
Xususan, bu borada tadqiqotchilar Aflotunning Gʻor allegoriyasini keltiradi. Yaʼni bu yerda biz modellarni oʻqitayotgan ayni maʼlumotlar soyalardir, voqelikning noaniq ifodasidir. Oldingi SI tizimlarimiz esa soyalarni kuzatuvchi odamlardir, yaʼni ular hayotga faqat qisman nazar soladi xolos.
Ammo masshtab bilan koʻp vazifalarni bajarishga majburlanganda asos modellar maʼlumotlarini meʼyordan oshirib yuborishi mumkin boʻladi. Oxir-oqibat haqiqatning asl mohiyatini oʻrganish uchun gʻordan chiqadi.
Odamlar hozir oʻrgatilayotgan maʼlumotlarni “soya” deb bilishi mumkin, chunki ular haqiqatning asl mohiyatini haligacha anglab yetmagan.
Bu shuni isbotlaydiki, bizning hozirgi SIni oʻqitish metodlarimiz inson maʼlumotlarini taqlidan oʻrganadi. U hech qachon (AGI) umumiy sunʼiy intellekt darajasiga yetib bora olmaydi. Hattoki super intellektga ham tenglasha olmaydi. Chunki insoniyatning cheklovlari dunyoni biz qanday koʻrsak, sunʼiy intellektni ham shunday koʻrishga majbur qiladi.
Bunday vaziyatda biz inson yaratgan tayyor materiallardan foydalanish oʻrniga SIga dunyoni kuzatish va undan oʻrganish uchun metodlar ishlab chiqmas ekanmiz, hech qachon umumiy sunʼiy intellekt yarata olmaymiz.
Masalan, sunʼiy intellektimiz bir kun kelib modallikdan (til, rasm va video modellari) tashqariga chiqib, mustaqil ravishda voqelikni qanday boʻlsa, shundayligicha kuzata oladi. Ana shunda ularning barchasi voqelikni bir xil talqin etadi.
Bu bilan nima demoqchimiz?
Vizual jihatdan quyidagi rasmga qaraganda frasm va fmatn dunyoning bir xil tushunchasini oʻrganadi. Shuning uchun ham ularning tasvirlari — vektorlari bir xil boʻlishi mumkin.
Bu zoʻr, albatta, lekin bizda sodir boʻlayotganini koʻrsatuvchi biror alomat bormi?
Birlashish
Ajablanarlisi asos modellar oʻzaro birlashyapti.
Koʻrish modellari bilan Large language modellar toʻplamini oʻzaro qiyoslaganda ularning uygʻunligi (ichki tasvirlarning qanchalik oʻxshashligi)da LLM ishlashi va koʻrish modeliga moslashishi oʻrtasida deyarli 1:1 aloqadorlik bor.
Oddiy til bilan aytganda, bizning LLM qanchalik yaxshi ishlasa, uning tasvirlari boshqa kuchli ko‘rish modellariga shunchalik o‘xshash bo‘ladi. Garchi ular butunlay boshqacha shaklda taqdim etilsa ham, ya’ni:
LLM qanchalik yaxshi bo‘lsa, ularning dunyo haqidagi tushunchalari ko‘rish modellariga shunchalik yaqinlashadi. Bu modellar qanchalik kattalashsa, ularning modalligi va ishlatilgan ma’lumotlardan qat’i nazar, barchasi bir xil tasvirga, voqelikni bir xil tushunishga yaqinlashayotgandek tuyuladi. Shuning uchun yanayam aqlliroq bo‘ladi.
Frontier modellarini DINO vision modeliga qiyoslash.
Nega bunday boʻlayotganining sababi quyidagi rasmda tasvirlangan. Model birdan ortiq muammolarni hal qilishning umumiy usulini topishi kerak. Shu sababdan ikkala topshiriqning mumkin boʻlgan yechimlari makoni kichrayadi:
Shunday qilib, model katta va koʻnikmalar toʻplami keng boʻlsa, bir-biriga yaqinlashishga moyil boʻladi. Uslubidan va ishlatilgan maʼlumotlar yigʻindisidan qatʼi nazar bir kun kelib barcha frontier laboratoriyalarimiz bir xil modelni yaratish uchun birlashishi mumkinligini belgilab beradi.
Muhim savollar soʻrash
SI falsafa bilan qachon birlashadi?
Men uchun eng qiziqarli nuqta, bu bozorda ulkan tovarlashuvchi ta’sirga ega bo‘lishi mumkin (hamma bir xil narsani yaratmoqda). Shuningdek, qanday qilib odamlar dunyoni kuzatadigan va bashorat qila oladigan sun’iy intellekt modellarini yaratishga yaqinlashayotganining birinchi belgisi desa ham boʻladi.
Bu kichik yutuq emas, chunki dunyo modellari deyarli har qanday sunʼiy intellekt sohasi uchun juda muhimdir. Ayniqsa, robotlarning kun kelib bizning dunyomizda yashashini tasavvur qiladiganlar uchun, shubhasiz, katta ahamiyatga ega.
Dunyo modellari sunʼiy intellektga atrof-muhitni kuzatish va unga moslashish imkoniyatini beradi. Chunki inson miyasi doimiy ravishda keyin nima sodir boʻlishini taxmin qiladi.
Agar odamlar haqiqatan ham dunyo modellarini qanday oʻqitishni aniqlasa, SI qanday darajaga yetishini soʻz bilan ifodalash qiyin. Eng kuchli modellar dunyoning bir xil tasviriga qanday birlashayotganini koʻrish, hech boʻlmaganda, yechimga yaqinlashayotganimizning belgisi sifatida qabul qilinishi mumkin.