Ваквите поделби претставуваат јаз меѓу различните јазици во однос на нивната функционална одржливост и присуство на Интернет.
Компанијата објави во блог пост дека нејзиниот модел SeamlessM4T поддржува преводи на текст и говор на речиси сто јазици, како и целосен превод од говор во говор за 35 јазици, комбинирајќи ја технологијата која претходно беше достапна само во посебни модели.
Извршниот директор на Мета, Марк Закерберг, рече дека има визија за алатки кои ги олеснуваат интеракциите меѓу корисниците од целиот свет во метаверзумот.
Во блог постот се наведува и дека Мета го прави својот модел достапен на јавноста за некомерцијална употреба.
Најголемата светска компанија за социјални медиуми објави голем број на главно бесплатни модели со вештачка интелигенција оваа година. Меѓу нив е и големиот јазичен модел LLaMA (Large Language Model Meta AI), дизајниран да им помогне на истражувачите на вештачката интелигенција да ја подобрат својата работа на ова поле.
Закерберг вели дека отворениот систем за вештачка интелигенција работи во корист на Мета, имајќи предвид дека компанијата ќе добие повеќе со ефективно снабдување за да создаде алатки погодни за корисниците за нејзините социјални платформи, отколку со наплата за пристап до моделите.
И покрај ова, Мета се соочува со слични правни проблеми како и остатокот од индустријата кога податоците за обука се внесуваат во моделот.
Во јули, стенд-ап комичарката Сара Силверман и уште двајца автори поднесоа тужби за прекршување на авторските права против Мета и OpenAI, обвинувајќи ги за неовластена употреба на нивната содржина за обука на јазици за вештачка интелигенција. Содржината беше заштитена со авторски права и користена од Мета и OpenAI за обука на чет-ботови.
Кога станува збор за моделот SeamlessM4T, истражувачите на Мета тврдат во нивниот истражувачки труд дека собрале податоци за аудио инструкции од четири милиони часа „сурово аудио кое потекнува од јавно достапно складиште на индексирани податоци на Интернет“, но не прецизирале за кое складиште се работи.
Портпаролот на Мета не одговори на прашањата за потеклото на аудио податоците. Во нивниот истражувачки труд е наведено и дека текстуалните податоци потекнуваат од збирки на податоци кои биле креирани минатата година, а содржините ги извлекле од Википедија и слични веб-страници,објави Техкранч.