ДАЙДЖЕСТ: |
Claude обычно придерживается просоциальных принципов, но в некоторых случаях демонстрировал отклонения, вероятно, из-за попыток пользователей обойти защитные механизмы. Новый метод оценки позволяет выявлять такие случаи на раннем этапе.
Ценности Claude адаптируются к контексту: он демонстрирует уважение в межличностных темах, историческую точность — в аналитике, интеллектуальную скромность — в философии, и экспертность — в маркетинге. В 28,2% бесед он поддерживает ценности пользователей, иногда излишне, а в 6,6% — переосмысливает убеждения. В 3% случаев сопротивляется пользовательским установкам.
Метод имеет ограничения: оценка ценностей субъективна, Claude сам участвовал в анализе, что могло повлиять на результат, и подход применим только к существующим системам. Anthropic открыла доступ к данным, делая ставку на прозрачность как конкурентное преимущество — на фоне инвестиций в $14 млрд от Amazon и Google.
Ранее YouTube представил ИИ для автоматического создания музыки. Также стало известно, сколько времени россияне проводят в интернете.
Автор: Дмитрий Иванов
![]() |
ЧЕЧНЯ. В Нашхе у озера построят спортивный комплекс и спа-центр
ЧЕЧНЯ. Международный аэропорт «Северный» имени Ахмата-Хаджи Кадырова откроют в 2026 году
ЧЕЧНЯ. Кадыров поставил цель: к 2035 году сделать Грозный одним из самых красивых городов России
АЗЕРБАЙДЖАН. Пашинян и Рахмон обсудили нормализацию отношений между Ереваном и Баку
В Госдуму внесут законопроект о лимите на домашних животных в квартирах
АЗЕРБАЙДЖАН. Россия и Азербайджан обменялись арестованными гражданами
ЧЕЧНЯ. Энергетики Чечни готовы к ливням, граду и шквалистому ветру
К 2030 году планируется автоматизировать почти 369 тысяч объектов газопотребления
АЗЕРБАЙДЖАН. Владимир Путин и Ильхам Алиев обнялись на неформальной встрече лидеров СНГ в Душанбе
ЧЕЧНЯ. В Грозном столкнулись «Лада Веста» и «Форд Фокус» — пострадавших нет.