Какво е ReALM?

ReALM означава “Решаване на референции като езиково моделиране”, иновативно решение, разработено от изследователи на Apple. Това е нов езиков модел (Large Language Model, LLM), който разглежда проблема с разпознаването на референции като задача в областта на езиковото моделиране.

ReALM ефективно преобразува различни видове контекст в текстово представяне, което след това обработва като част от езикова задача. Това може да включва:

  • разговори – като текстови съобщения, гласови команди към асистент или имейли,
  • елементи на екрана – например, снимки, календар, метеорологичен виджет или приложения и процеси, работещи във фонов режим.

Какво прави ReALM различен от другите модели за разпознаване на референции? Първо, подходът – вместо да разчита на обработка на изображения, ReALM работи в текстовата област. Това го прави много по-лек и ефективен, което би трябвало да му позволи да работи директно на мобилни устройства, като същевременно запазва личната неприкосновеност на потребителите.

С какво ReALM е по-добър от GPT-4?

Изследователският екип на Apple сравни ReALM с най-мощните езикови модели на пазара днес – GPT-3.5 и GPT-4 от OpenAI. Резултатите бяха впечатляващи. В задачите за разпознаване на референции, най-малкият вариант на ReALM постигна точност, сравнима с GPT-4! По-големите модели на ReALM дори надминаха GPT-4 в разпознаването на референции към елементи, показвани на екрана (http://arxiv.org/abs/2403.20329).

Какво обяснява това предимство? Първо, ReALM е отличен с домейн-специфични запитвания, като тези, свързани с интелигентни домашни уреди. Това е така, защото ReALM демонстрира по-дълбоко разбиране на контекста, като фино настройва модела за домейн-специфични данни.

Освен това, за разлика от GPT-4, който се обучава основно на изображения на реални обекти, ReALM блести в разпознаването на текстови елементи и компоненти на потребителските интерфейси на приложения. И разбирането на интерфейса е критично за гладкото взаимодействие на гласовите асистенти с приложенията, които използваме днес.

ReALM

Източник: DALL·E 3, подтик: Марта М. Кания (https://www.linkedin.com/in/martamatyldakania/)

Това ли е началото на ерата на наистина интелигентни асистенти?

Наистина, интеграцията на ReALM с Siri може да отвори нова глава в човешко-компютърното взаимодействие. С ReALM, Siri ще може да разбира команди, които включват референции към елементи, показвани на екрана на смартфона, както и процеси и приложения, работещи във фонов режим. Но кога ще бъде налична тази опция за потребителите? Това все още е неизвестно.

Оставаме с спекулации, основани на техническите възможности на модела. Как би могъл да работи Siri, захранван от ReALM? Например, ако разглеждате сайт с бизнес обяви и видите компания, която ви интересува, можете просто да кажете на Siri: “Обади се на тази компания”, а асистентът – използвайки ReALM за анализ на контекста – ще намери телефонния номер на посочената от вас компания и ще инициира обаждането. Не е нужно дори да обяснявате точно коя компания имате предвид.

И това е само началото на възможностите на ReALM. Команди като “Възпроизведи последния плейлист” биха позволили интуитивно управление на мултимедийните приложения и интелигентните домашни устройства. ReALM би могъл също да позволи на Siri да разбира контекста на разговорите и историята на командите, така че асистентът да реагира адекватно на предишните искания на потребителя. Това е стъпка към интелигентни агенти, приближаваща ни не толкова до изкуствена интелигенция, която разбира нашите запитвания, а до такава, която знае как да изпълнява команди.

И това е само началото на това, което ReALM може да направи. Команди като “възпроизведи последния плейлист” биха позволили интуитивно управление на мултимедийните приложения и интелигентните домашни устройства. ReALM би могъл също да позволи на Siri да разбира контекста на разговорите и историята на командите, така че асистентът да реагира адекватно на предишните искания на потребителя. Това е стъпка към интелигентни агенти, приближаваща ни не до изкуствена интелигенция, която разбира нашите запитвания, а до такава, която знае как да изпълнява команди.

За съжаление, потребителите на Android устройства ще трябва да изчакат. В момента няма информация за плановете на Google да добави възможностите на Gemini към Google Assistant. Приложение на Google Gemini за Android устройства е разработено (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), но все още не е налично извън Съединените щати.

ReALM

Източник: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Резюме

ReALM е иновативният подход на Apple за решаване на проблема с разпознаването на контекст от гласовите асистенти. Вместо да разчита на обработка на изображения, този езиков модел преобразува различни видове контекст в текстово представяне, което след това обработва в езикова задача. Този подход осигурява не само висока точност на разпознаване, но и способността да работи на мобилно устройство, като същевременно запазва личната неприкосновеност на потребителите.

Даването на достъп на Siri до ReALM може да осигури по-естествени и контекстуални гласови взаимодействия, важна стъпка към наистина интелигентни асистенти. С ReALM, Siri ще може незабавно да отговаря на команди, свързани с елементи на екрана, приложения и фонови процеси. Едно е сигурно – подобряването на контекстуалната осведоменост на асистентите е ключът към създаването на наистина интелигентни и естествени гласови взаимодействия, а ReALM е безспорно важна стъпка в тази посока.

ReALM

Ако харесвате нашето съдържание, присъединете се към нашата общност на заети пчели в Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

Експерт по JavaScript и инструктор, който обучава ИТ отдели. Основната му цел е да повиши продуктивността на екипа, като учи другите как да си сътрудничат ефективно при програмирането.

View all posts →

AI in business:

  1. 6 страхотни плъгини за ChatGTP, които ще направят живота ви по-лесен
  2. Навигиране на нови бизнес възможности с ChatGPT-4
  3. 3 страхотни AI писатели, които трябва да изпробвате днес
  4. Синтетични актьори. Топ 3 генератора на видео с изкуствен интелект
  5. Какви са слабостите на моята бизнес идея? Сесия за мозъчна атака с ChatGPT
  6. Използване на ChatGPT в бизнеса
  7. Нови услуги и продукти, работещи с ИИ
  8. Автоматизирани публикации в социалните медии
  9. Планиране на публикации в социалните медии. Как може ИИ да помогне?
  10. Ролята на ИИ в бизнес вземането на решения
  11. Бизнес НЛП днес и утре
  12. AI-подпомагани текстови чатботове
  13. Приложения на ИИ в бизнеса - преглед
  14. Заплахи и възможности на ИИ в бизнеса (част 2)
  15. Заплахи и възможности на ИИ в бизнеса (част 1)
  16. Какво е бъдещето на ИИ според McKinsey Global Institute?
  17. Изкуствен интелект в бизнеса - Въведение
  18. Какво е НЛП, или обработка на естествен език в бизнеса
  19. Google Translate срещу DeepL. 5 приложения на машинния превод за бизнеса
  20. Автоматична обработка на документи
  21. Операцията и бизнес приложенията на гласовите ботове
  22. Технология на виртуалните асистенти, или как да говорим с ИИ?
  23. Какво е бизнес интелигентност?
  24. Как може изкуственият интелект да помогне с BPM?
  25. Креативен ИИ на днешния ден и утре
  26. Изкуствен интелект в управлението на съдържанието
  27. Изследване на силата на ИИ в създаването на музика
  28. 3 полезни инструмента за графичен дизайн с изкуствен интелект. Генеративен ИИ в бизнеса
  29. Изкуствен интелект и социални медии – какво казват те за нас?
  30. Ще замени ли изкуственият интелект бизнес анализаторите?
  31. Инструменти за изкуствен интелект за мениджъра
  32. Бъдещият пазар на труда и предстоящите професии
  33. RPA и API в дигитална компания
  34. Нови взаимодействия. Как изкуственият интелект променя начина, по който управляваме устройствата?
  35. Мултимодален ИИ и неговите приложения в бизнеса
  36. Изкуствен интелект и околната среда. 3 решения с ИИ, които да ви помогнат да изградите устойчив бизнес
  37. Детектори за съдържание с изкуствен интелект. Струват ли си?
  38. ChatGPT срещу Bard срещу Bing. Кой AI чатбот води в състезанието?
  39. Чатбот AI ли е конкурент на търсенето в Google?
  40. Ефективни ChatGPT подсказки за HR и набиране на персонал
  41. Проектиране на подсказки. Какво прави инженер по подсказки?
  42. Изкуствен интелект и какво още? Водещи технологични тенденции за бизнеса през 2024 година
  43. Изкуствен интелект и бизнес етика. Защо трябва да инвестирате в етични решения
  44. Мета ИИ. Какво трябва да знаете за функциите, поддържани от ИИ на Facebook и Instagram?
  45. Регулиране на изкуствения интелект. Какво трябва да знаете като предприемач?
  46. 5 нови приложения на ИИ в бизнеса
  47. AI продукти и проекти - как се различават от другите?
  48. AI като експерт в екипа ви
  49. AI екип срещу разпределение на роли
  50. Как да изберем професионална област в изкуствения интелект?
  51. Изкуствен интелект в HR: Как автоматизацията на наемането влияе на HR и развитието на екипа
  52. Автоматизация на процеси с помощта на изкуствен интелект. От къде да започнем?
  53. 6-те най-интересни инструмента за изкуствен интелект през 2023 година
  54. Какъв е анализът на зрелостта на ИИ в компанията?
  55. AI за B2B персонализация
  56. Случаи на употреба на ChatGPT. 18 примера как да подобрите бизнеса си с ChatGPT през 2024 година
  57. Генератор на AI макети. Топ 4 инструмента
  58. Микрообучение. Бърз начин за придобиване на нови умения
  59. Най-интересните реализации на ИИ в компаниите през 2024 година
  60. Какви предизвикателства носи проектът за изкуствен интелект?
  61. Топ 8 AI инструмента за бизнес през 2024 година
  62. Изкуствен интелект в CRM. Какво променя изкуственият интелект в инструментите за CRM?
  63. Законът за изкуствения интелект на ЕС. Как Европа регулира използването на изкуствен интелект
  64. Топ 7 AI строители на уебсайтове
  65. Инструменти без код и иновации в изкуствения интелект
  66. Колко увеличава използването на ИИ производителността на вашия екип?
  67. Как да използваме ChatGTP за пазарно проучване?
  68. Как да разширите обхвата на вашата AI маркетингова кампания?
  69. Изкуствен интелект в транспорта и логистиката
  70. Какви бизнес проблеми може да реши изкуственият интелект?
  71. Как да съчетаете AI решение с бизнес проблем?
  72. Изкуствен интелект в медиите
  73. Изкуствен интелект в банковото дело и финансите. Stripe, Monzo и Grab
  74. Изкуствен интелект в туристическата индустрия
  75. Как ИИ насърчава раждането на нови технологии
  76. Изкуствен интелект в електронната търговия. Преглед на глобалните лидери
  77. Топ 4 инструмента за създаване на изображения с изкуствен интелект
  78. Топ 5 AI инструмента за анализ на данни
  79. Революцията на ИИ в социалните медии
  80. Винаги ли си струва да се добавя изкуствен интелект в процеса на разработка на продукта?
  81. 6-те най-големи бизнес неуспеха, причинени от ИИ
  82. AI стратегия в компанията ви - как да я изградите?
  83. Най-добрите курсове по ИИ – 6 страхотни препоръки
  84. Оптимизиране на слушането в социалните медии с инструменти за изкуствен интелект
  85. IoT + AI, или как да намалим разходите за енергия в компанията
  86. Изкуствен интелект в логистиката. 5 най-добри инструмента
  87. GPT Магазин – преглед на най-интересните GPT за бизнес
  88. LLM, GPT, RAG... Какво означават акронимите на ИИ?
  89. AI роботи – бъдещето или настоящето на бизнеса?
  90. Каква е цената за внедряване на изкуствен интелект в компания?
  91. Какво правят специалистите по изкуствен интелект?
  92. Как може ИИ да помогне в кариерата на фрийлансера?
  93. Автоматизиране на работата и увеличаване на производителността. Ръководство за изкуствен интелект за фрийлансъри
  94. AI за стартиращи компании – най-добрите инструменти
  95. Създаване на уебсайт с ИИ
  96. Елевън Лабс и какво още? Най-перспективните стартиращи компании в сферата на изкуствения интелект
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Кой е кой в света на изкуствения интелект?
  98. Синтетични данни и тяхното значение за развитието на вашия бизнес
  99. Водещи AI търсачки. Къде да търсим AI инструменти?
  100. Видео ИИ. Най-новите генератори на видео с изкуствен интелект
  101. Изкуствен интелект за мениджъри. Как изкуственият интелект може да улесни работата ви
  102. Какво ново в Google Gemini? Всичко, което трябва да знаете
  103. Изкуствен интелект в Полша. Компании, срещи и конференции
  104. AI календар. Как да оптимизирате времето си в компанията?
  105. Изкуствен интелект и бъдещето на работата. Как да подготвим бизнеса си за промяна?
  106. AI гласово клониране за бизнес. Как да създадем персонализирани гласови съобщения с AI?
  107. "Всички ние сме разработчици". Как могат гражданските разработчици да помогнат на вашата компания?
  108. Фактологична проверка и халюцинации на ИИ
  109. Изкуствен интелект в набиране на персонал – разработване на материали за набиране стъпка по стъпка
  110. Сора. Как ще променят реалистичните видеа от OpenAI бизнеса?
  111. Midjourney v6. Иновации в генерирането на изображения с изкуствен интелект
  112. Изкуствен интелект в малките и средни предприятия. Как могат малките и средни предприятия да се конкурират с гигантите, използвайки изкуствен интелект?
  113. Как изкуственият интелект променя маркетинга с влиятели?
  114. Наистина ли ИИ е заплаха за разработчиците? Девин и Microsoft AutoDev
  115. Най-добрите AI чатботове за електронна търговия. Платформи
  116. AI чатботове за електронна търговия. Казуси
  117. Как да бъдете в крак с това, което се случва в света на изкуствения интелект?
  118. Укротяване на ИИ. Как да направите първите стъпки за прилагане на ИИ в бизнеса си?
  119. Перплексити, Бинг Копилот или You.com? Сравнение на AI търсачки
  120. AI експерти в Полша
  121. ReALM. Пробивен езиков модел от Apple?
  122. Google Genie — генеративен AI модел, който създава напълно интерактивни светове от изображения
  123. Автоматизация или увеличаване? Два подхода към ИИ в компанията
  124. LLMOps, или как ефективно да управляваме езикови модели в организацията
  125. Генерация на видео с изкуствен интелект. Нови хоризонти в производството на видео съдържание за бизнеса
  126. Най-добрите инструменти за транскрипция с изкуствен интелект. Как да преобразуваме дълги записи в кратки резюмета?
  127. Анализ на настроението с ИИ. Как помага за предизвикване на промяна в бизнеса?
  128. Ролята на ИИ в модерирането на съдържание