Gemini 2.5: Революция в генерации изображений

#ReDigest

Продолжаем субботнюю рубрику, тут я кратко рассказываю про новости из мира технологий и AI, которые привлекли мое внимание.

Дайджест недели:

- Google выпустили Gemini 2.5 Flash Image (aka "nano banana") - новую модель для генерации и редактирования изображений. Главная фишка - консистентность персонажей между разными изображениями. Бесплатно в Gemini, через API $0.039 за изображение - на 95% дешевле OpenAI.

- OpenAI релизнули speech2speech модель gpt-realtime и сделали Realtime API общедоступным. Модель заточена под голосовых помощников с поддержкой MCP и инпута картинками. Цены снизили на 20%.

- Специалисты ESET обнаружили первый компьютерный вирус на основе LLM. PromptLock использует AI-агента для анализа локальных файлов, генерации персонализированных угроз и создания кода для шифрования. Пока что прототип, но тренд ясен.

- Apple планирует трехлетний перезапуск iPhone. Начнется с iPhone Air в 2025 году с собственным модемом вместо Qualcomm, продолжится складным iPhone в 2026 году с практически незаметной складкой, завершится изогнутым iPhone 20 в 2027-м.

- Илон Маск и xAI подали антимонопольный иск против Apple и OpenAI. Обвиняют в том, что интеграция ChatGPT в iOS создает антиконкурентные преимущества, а X и Grok не попадают в подборки App Store.

- Anthropic запустили превью Claude для Chrome в режиме ограниченного пилота с 1000 пользователей Max плана. Агент может выполнять задачи в браузере, но пока блокирует финансовые сайты из-за рисков безопасности.

- xAI представили grok-code-fast-1 - скоростную и экономичную модель для агентского кодинга. Неделю доступна бесплатно в Cursor, Windsurf и других инструментах, цена через API $0.2/$1.5 за миллион токенов с кэшированием до 2 центов.

- Nvidia стартовала продажи Jetson AGX Thor за $3,499 - самой мощной платформы для робототехники с фантастической плотностью вычислений при низком энергопотреблении (2560 ядер Blackwell, 128 ГБ памяти).

- OpenAI и Anthropic ненадолго приоткрыли друг другу доступ к моделям для совместного тестирования безопасности. Claude отказывается отвечать в 70% сомнительных случаев, GPT пытается ответить почти всегда и галлюцинирует чаще.

- Sakana AI опубликовали метод M2N2 для применения эволюционных принципов к AI. Модели обмениваются параметрами, конкурируют за данные и специализируются - так можно даже обучать модели с нуля без градиентов.

- Taco Bell развернули голосовой AI на 500+ точках и выяснили: часть клиентов раздражают глюки, часть не готова говорить с машиной. Теперь допускают, что AI не должен работать повсеместно.

- Codex CLI, который теперь включен в подписку ChatGPT Plus/Pro/Team - в него добавили поддержку изображений, расширения для VSCode и автоматическое ревью пулреквестов.

- Google обновили NotebookLM: Video Overviews доступны на 80 языках, Audio Overviews стали более детальными. Неанглийские версии теперь не уступают английской по качеству обсуждения источников.

📎 Ссылки в посте:
• Продолжаем
• выпустили
• релизнули
• обнаружили
• планирует
• подали
• запустили
• представили
• стартовала
• ненадолго приоткрыли
• опубликовали
• развернули
• включен
• обновили

🏷️ Хештеги: #ReDigest

#technology

RU

SAFE

Анализ ИИ

Это еженедельный дайджест новостей из мира технологий и искусственного интеллекта. Пост информативен, содержит ссылки на первоисточники и не содержит негативной информации.

88

Pyrlo AI bot (RU)

Gemini 2.5: Революция в генерации изображений

Анализ ИИ

Больше на тему