От такс до ИИ: дайджест науки, масштабов и абсурда

0
23

Новости науки и технологий часто сталкиваются с фундаментальной проблемой: как сделать непостижимое осязаемым? Будь то необъятность космоса или сложность государственных данных, масштабы современных достижений могут казаться чем-то абстрактным.

В этом обзоре мы рассмотрим, как журналисты пытаются преодолеть этот разрыв — порой прибегая к причудливым сравнениям — и какие риски возникают, когда мы перепоручаем критически важные задачи искусственному интеллекту.

Измерение Луны таксами

Недавняя миссия Artemis II достигла исторической вехи: экипаж удалился от Земли на 406 771 километр — это самое дальнее расстояние, на которое когда-либо ступал человек. Однако донести это расстояние до широкой аудитории — задача не из легких.

Чтобы наглядно продемонстрировать масштаб, The New York Times использовала ряд необычных, почти сюрреалистичных единиц измерения:

  • Метрика такс: Если выстроить такс длиной 22 дюйма (около 56 см) в одну линию нос к хвосту, вам понадобится примерно 728 миллионов собак, чтобы добраться до Луны.
  • Метрика ходьбы: При бодром темпе ходьбы (около 5 км/ч) человеку потребовалось бы почти 10 лет непрерывного движения, чтобы преодолеть это расстояние.
  • Метрика хот-догов: Цепочка из 2,37 миллиарда хот-догов заполнила бы этот промежуток. Чтобы съесть их все, профессиональному едоку пришлось бы питаться без остановки в течение 594 лет.

Хотя такие сравнения помогают «почувствовать» дистанцию, они ставят под вопрос научную строгость. Использование живых животных (или переработанного мяса) в качестве линейки вносит огромную погрешность из-за различий в размерах и форме. Более того, переход от «живых собак» к «хот-догам» в качестве единиц измерения подчеркивает общую тенденцию в научной журналистике: принесение точности в жертву вовлеченности аудитории.

Проблема относительного масштабирования

Помимо физического расстояния, сам язык часто не способен обеспечить точные измерения. Это подводит нас к концепции эндогенного относительного масштабирования (ERS) — единиц, значение которых меняется в зависимости от контекста или использующего их человека.

Классический пример — слово «марафон».
— В легкой атлетике это фиксированная дистанция в 42,195 километра.
— В повседневной жизни это субъективное описание продолжительности, например, «марафонская учебная сессия» или «марафонский забег за выпивкой».

Значение «марафона» в этих контекстах полностью зависит от деятельности и, что, возможно, более важно, от индивидуального порога выносливости. Эта лингвистическая размытость напоминает нам, что даже в мире твердых данных человеческое восприятие остается субъективным фильтром.

Риск в 4%: ИИ в государственной классификации

По мере того как искусственный интеллект всё глубже интегрируется в профессиональные рабочие процессы, открываются новые горизонты: использование больших языковых моделей (LLM) для выполнения деликатных задач, таких как классификация государственных документов.

В недавней работе на ресурсе arXiv было предложено использовать ИИ, чтобы заменить «трудоемкий» и «субъективный» процесс ручной маркировки документов. Исследователи протестировали модель на утечке дипломатических документов США и достигли точности в 96% при разграничении документов с грифом «не секретно», «конфиденциально» и «секретно».

Хотя 96% звучит впечатляюще, в мире национальной безопасности это выявляет критический изъян:
1. Пробел утечки: Ошибка в 4% означает, что сверхсекретная информация может систематически классифицироваться как «не секретная», что приведет к катастрофическим утечкам.
2. Направленность ошибки: В ситуациях с высокими ставками не все ошибки равнозначны. Если ИИ пометит «секретный» документ как «не секретный» — это провал системы безопасности; если же он пометит «не секретный» документ как «секретный» — это всего лишь бюрократическая неудобство.

В исследовании пока не уточняется, склонен ли ИИ к излишней осторожности или к халатности, а также как его точность соотносится с точностью экспертов-людей.

Заключение: Используем ли мы такс для измерения Луны или ИИ для сортировки государственных тайн, мост между необработанными данными и человеческим пониманием полон субъективности, причудливых ошибок и значительных системных рисков.