Sun'iy Intellekt
Mashinani oʻqitish: 10 ta mashhur ML metodi va algoritmlari
Chiziqli regressiyaning logistikadan farqi nimada? Hal qiluvchi daraxtlar va tasodifiy oʻrmonning mashinani oʻqitishga qanday aloqasi bor?
Mashinani oʻqitish — sunʼiy intellektning kompyuterlarga biron-bir dasturlashsiz tajribadan oʻrganish imkoniyatini beradigan sohasi. Texnologiya katta hajmdagi maʼlumotlarni qayta ishlash, ulardagi qonuniyatlarni aniqlash va yuqori aniqlik bilan prognoz qilishga imkon beradi. Yugurish vaqtida siz uchun maxsus yaratilgan pleylistning ishga tushishi yoki qiziqishlaringizga koʻra mahsulotlar toʻplamini koʻrishingiz — bularning barchasi mashinani oʻqitish natijasidir.
Maqolada kompyuterlarning qanday oʻqishi, foydalanuvchilar yordami, qachon ularga oʻqituvchi kerak boʻlishi haqida va boshqa mavzularda soʻz yuritamiz.
Mashinani oʻqitishning qanday usullari bor?
Mashinani oʻqitishning uch turi mavjud:
Nazorat ostidagi oʻqitish. Oʻqitish boshlanishidan oldin “oʻqituvchi”, yaʼni odam toʻgʻri javobni biladi. Faqat mashinani toʻgʻri javobni tanlash mantigʻini tushunishga oʻrgatish kerak boʻladi.
Nazorat qilinmaydigan oʻqitish. Oʻqitish boshlanishidan oldin toʻgʻri javoblar boʻlmaydi. Model maʼlumotlarning katta massivini tahlil qilishni, yashirin bogʻliqlik va algoritmlarni qidirishni oʻrganadi.
Mustahkamlovchi oʻqitish. Oʻqitish foydalanuvchi amallarining variativligi asosida amalga oshiriladi. Misol sifatida kompyuter bilan shaxmat, narda yoki shashka oʻyinlarini keltirish mumkin. Model foydalanuvchilarning yurishlarini eslab qoladi va strategiyani oldindan hisoblashni oʻrganadi.
Maqolada oʻqitishning birinchi usuli – nazorat ostidagi yoki oʻqituvchi bilan oʻqitish haqida soʻz boradi.
Chiziqli regressiya
Ketma-ketlikni davom ettirish kerak boʻlgan matematika boʻyicha oddiy maktab testlarini eslaysizmi? Masalan: 2, 4, 6, 8, X. Intuitiv ravishda X oʻrnida 10 boʻlishi kerakligini bilasiz.
Chiziqli regressiya mashinani oʻzgaruvchilar oʻrtasidagi mana shunday bogʻlanishlarni izlashga oʻrgatadi. Bu usul bir oʻzgaruvchining boshqasiga qanday taʼsir qilishini taxmin qilish kerak boʻlgan iqtisodiyot, moliya, marketing va boshqa sohalarda keng qoʻllanadi.
Bu model bir yoki ikki oddiy bogʻlanishni hisobga oladigan sodda usul ekanini tushunish muhim.
Qaysi maqsadlarda foydalaniladi: uy-joy narxlari, aksiyalarni baholash, sotishni prognozlashda.
Mantiqiy regressiya
Mashinani oʻqitishning obyektlarni tasnif va toifalarga ajratish imkonini beradigan yana bir oddiy mexanizmi. Chiziqli regressiya singari bu algoritm ham kam sonli bogʻlanishlar bilan ishlaydi va tadqiqot mavzusini atigi ikkita toifaga ajratadi.
Masalan, abituriyentlarni imtihonning oʻtish ballari chegarasidan oʻtgan va oʻtmaganlarga ajratish vazifasi berilgan. Agar biz oʻtish qiymatini 150 ball deb belgilasak, model abituriyentlarni undan yuqori va past toifalarga ajratadi. Shu bilan birga, mantiqiy regressiya yordamida imtihonni 160–180, 180–200 ball bilan topshirganlar foizini bilsa boʻladi. Oʻtganlar orasida yigitlar yoki qizlar, shahar yoki qishloq aholisi koʻproq boʻlganini aniqlab boʻlmaydi.
Shu bilan birga, statistikani tasniflash orqali voqealar sodir boʻlishini prognoz qilish imkoniyatiga ega boʻlamiz.
Qaysi maqsadlarda foydalaniladi: bank tomonidan kreditlashda defolt ehtimolini baholash uchun.
Hal qiluvchi daraxtlar
Hal qiluvchi daraxtlar yoki qaror qabul qilish daraxtlari yanada murakkab algoritm. U turli xil sharoitlarni qamrab olishga va maʼlumotlarni “daraxt shoxlari” orqali tasniflashga harakat qiladi. Bu murakkab narsadek tuyuladi, lekin siz bu usulga bir necha bor duch kelgansiz. Shunchaki rasmga qarang:
Kishi koʻpincha bunday algoritmlarga rioya qilgan holda qaror qabul qilgani kabi mashina ham tahlil uchun inson maʼlumotlarini jalb qilmasdan avtomatik ravishda bajarishni oʻrganadi.
Usulning salbiy jihati bor: daraxt tasnifning barcha nozik tomonlarini hisobga olish uchun yetarlicha katta emas. Demak, maʼlumotlarni soddalashtirish va umumlashtirish yoki yanada murakkab mexanizmni, masalan, daraxtlardan iborat butun boshli oʻrmonni dasturlash kerak.
Qaysi maqsadlarda foydalaniladi: tibbiyotdagi diagnostika tizimlarida.
Tasodifiy oʻrmon
Nomidan koʻrinib turganidek, bu qaror qabul qilish daraxtlarining butun boshli oʻrmoni. Algoritm maʼlumotni bitta daraxt orqali emas, balki variativ natijalarga ega yuzlab daraxtlar orqali oʻtkazadi. Shu tarzda tahlil yanada aniqroq boʻladi.
Har bir daraxtni tahlil qilish natijalari eng ommabopiga asoslangan holda umumiy qaror koʻrinishida yigʻiladi.
Qaysi maqsadlarda foydalaniladi: bioinformatikadagi genom tahlili kabi katta maʼlumotlar toʻplamlari uchun.
Busting
Daraxtlarning butun boshli oʻrmoni kerakli natijani bermagan taqdirda busting yordamga keladi. Bu usulni tushunish oson: xatoga yoʻl qoʻyadigan birinchi daraxtni quramiz. Bu xatoga tayangan holda ikkinchi daraxtni quramiz. U yana xato qiladi. Xatoni koʻrsatamiz va uchinchi daraxtni quramiz. Bu harakatlar natija maksimal aniqlikka erishgunga qadar davom etadi.
Natija maksimal aniqlikka erishganini qanday aniqlash mumkin? Bu juda oson: dastlab daraxtlar xatolarini tahlil qilib, aniqroq natija beradi. Soʻngra aniqlik choʻqqisiga chiqadi va yana koʻproq xatolarga yoʻl qoʻya boshlaydi.
Bu usulda eng muhimi oʻz vaqtida toʻxtashdir.
Qaysi maqsadlarda foydalaniladi: moliya sohasida xatarlarni boshqarish uchun.
K-yaqin qoʻshnilar usuli
Bu oʻqitish algoritmi oʻxshash xususiyatlarga ega obyektlarni guruhlarga birlashtiradi. Usul oʻxshash xususiyatlarga ega barcha obyektlar bir-biriga yaqin joylashgan faraziga koʻra qurilgan ixchamlik gipotezasiga asoslangan. Yaʼni usulning maʼnosi uning nomida yashiringan. U bir-biriga qoʻshni boʻlgan obyektlarni bir xil toʻplamlarga birlashtiradi.
Shu bilan birga, k-yaqin qoʻshnilar algoritmi koʻpincha adashadi. U bir-biriga yaqin joylashgan obyektlar turli xil xususiyatlarga ega boʻlishi mumkinligini hisobga olmaydi.
Qaysi maqsadlarda foydalaniladi: tavsiya tizimlari va mijozlar segmentatsiyasi uchun.
ML injener boʻling
Bizdagi Data Science va SI kursini bitirgandan soʻng ML injener kasbini egallaysiz. Sizni nazariya bilan cheklab qoʻymaymiz. Kurs davomida ChatGPTʼga oʻxshash SI modellar yaratasiz. Kursimiz IBM, Kaggle va Google kompaniyalari oʻquv dasturi asosida tuzilgan. Darslar Mohirdev asoschisi Anvar Narzullayev tomonidan oʻtiladi.
Tayanch vektorlar usuli
K-yaqin qoʻshnilar usuli obyektlar oʻrtasida tekis chegaralar yaratadi. Tayanch vektorlar usuli hajmli tekislikda ishlaydi va obyektlarni toʻgʻri emas, balki egri chiziqlar boʻyicha ajratadi. Shu bilan birga, obyektlarning har bir guruhi boʻlinish tekisligidan iloji boricha uzoqroq joylashgan boʻlishi muhim.
Qaysi maqsadlarda foydalaniladi: obrazlarni aniqlash va matnni tasniflashda.
Bayesning sodda klassifikatori
Obyektlarni tasniflashda yordam beradigan yana bir usul. Usul XVIII asrda yashagan ingliz matematigi Bayes teoremasiga asoslangan.
Bu ehtimollik nazariyasining bazaviy teoremasi hisoblanadi. U biror voqea ehtimolini sodir boʻlgan boshqa voqealar yoki oqibatlar asosida prognoz qiladi. Bayes klassifikatori keng foydalaniladigan soha spamni filtrlashdir. Har bir xat spam deb hisoblanishi mumkin boʻlgan soʻzlar soniga qarab baholanadi. Algoritm asta-sekin spamni aniqlashning yangi usullarini oʻrganadi.
Qaysi maqsadlarda foydalaniladi: spam-filtrlar va hissiyotlarni tahlil qilishda.
Neyrotarmoqlar
Soʻnggi yillarda internetni ishonchli tarzda zabt etgan nisbatan yangi algoritm. Neyron tarmoqlari inson miyasi faoliyatiga taqlid qiladi, obrazlarni tanib oladi, nutqni qayta ishlaydi va avtonom tarzda ishlaydi.
Neyron tarmogʻining ishi qanday qurilishini tushunishga harakat qilib koʻramiz. Dastlab klassifikator quriladi. Masalan: qulupnay – qizil, limon – sariq rangga ega. Tarmoq buyumni oʻrganib chiqadi (piksel ranglarini eslab qoladi) va keyinchalik obyektlarni klassifikatorga muvofiq baholashi mumkin.
Bitta neyron bilan qiyin. Barcha qizil narsalar qulupnayga, sariq narsalar limonga aylanadi, qolgan rangdagi narsalar esa shunchaki neyron tarmogʻi nazaridan yoʻqoladi. Shuning uchun bir-biriga bogʻlangan minglab neyronlar yaratiladi.
Eʼtiborga loyiq tomoni, neyrotarmoqning oʻzi yangi neyron bogʻlanishlarni yaratadi, dasturchi esa berilgan javoblarga koʻra faqat ragʻbatlantirishi yoki jazolashi mumkin.
Qaysi maqsadlarda foydalaniladi: ular avtonom boshqarishdan tortib ijod jarayonini avtomatlashtirishgacha boʻlgan turli sohalardagi murakkab vazifalarni uddalay oladi.
Oʻrama neyrotarmoqlar
Bu neyrotarmoqlarning vizual kontent — fotosurat, video, rasmlarga ixtisoslashgan alohida sinfi. Ammo gap rasmlarni generatsiya qiladigan neyrotarmoqlar haqida deb oʻylamang.
Aksincha, buning aksi. Oʻrama neyrotarmoqlar obyektni aniqlaydi va tasniflaydi. Masalan, neyrotarmoq tashqi koʻrinishiga koʻra odamni tanishi, soʻngra yuzning ayrim qismlariga diqqatni jamlab, koʻz va sochlarning rangini tasniflashi mumkin.
Qaysi maqsadlarda foydalaniladi: kompyuter nigohida tasvirni aniqlash va video tahlil uchun.
Manba: Машинное обучение: 10 популярных методов и алгоритмов ML