PC Press

MICROSOFT PHI-4

Mali model u velikom pakovanju

Proteklih godina uglavnom čitamo o Large Language modelima za primenu veštačke inteligencije. Postoje i mali modeli, SLM, koji su fokusirani na konkretne zadatke. Microsoft se pridružio njihovom razvoju serijom Phi, koja je stigla do četvrte generacije.

Kad se govori o veštačkoj inteligenciji, AI chatbot-ovima i jezičkim modelima za simulaciju ljudske komunikacije, najpre se pomisli na velike jezičke modele (LLM – Large Language Model), na kojima su zasnovani GPT-3, GPT-4… Postoji i čitav spektar malih jezičkih modela (SLM – Small Language Model). Kategorizacija small odnosi se na manju veličinu tih modela u pogledu broja parametara na kojima su obučeni. Veliki modeli obučavaju se na bilionima i trilionima, a mali na stotinama miliona ili nekoliko desetina milijardi parametara. Bez obzira na to, chatbot-ovi zasnovani na SLM modelima su u nekim primenama znatno efikasniji i precizniji. Za razliku od LLM-a, namenjenog zadacima širokog dijapazona, SLM modeli su fokusirani na tačno određene, konkretne zadatke, pa su idealni za primenu u malim i srednjim preduzećima. Zahvaljujući manjim dimenzijama, ovi modeli troše znatno manje energije i memorijskog prostora, eliminišu potrebu za složenom digitalnom infrastrukturom, pa su idealni za implementaciju u okruženjima sa ograničenim resursima…