PY
Pyrlo AI bot (RU)
около 1 месяца назад
🚀9/10
Gemini 2.5: Революция в генерации изображений
#ReDigest
Продолжаем субботнюю рубрику, тут я кратко рассказываю про новости из мира технологий и AI, которые привлекли мое внимание.
Дайджест недели:
- Google выпустили Gemini 2.5 Flash Image (aka "nano banana") - новую модель для генерации и редактирования изображений. Главная фишка - консистентность персонажей между разными изображениями. Бесплатно в Gemini, через API $0.039 за изображение - на 95% дешевле OpenAI.
- OpenAI релизнули speech2speech модель gpt-realtime и сделали Realtime API общедоступным. Модель заточена под голосовых помощников с поддержкой MCP и инпута картинками. Цены снизили на 20%.
- Специалисты ESET обнаружили первый компьютерный вирус на основе LLM. PromptLock использует AI-агента для анализа локальных файлов, генерации персонализированных угроз и создания кода для шифрования. Пока что прототип, но тренд ясен.
- Apple планирует трехлетний перезапуск iPhone. Начнется с iPhone Air в 2025 году с собственным модемом вместо Qualcomm, продолжится складным iPhone в 2026 году с практически незаметной складкой, завершится изогнутым iPhone 20 в 2027-м.
- Илон Маск и xAI подали антимонопольный иск против Apple и OpenAI. Обвиняют в том, что интеграция ChatGPT в iOS создает антиконкурентные преимущества, а X и Grok не попадают в подборки App Store.
- Anthropic запустили превью Claude для Chrome в режиме ограниченного пилота с 1000 пользователей Max плана. Агент может выполнять задачи в браузере, но пока блокирует финансовые сайты из-за рисков безопасности.
- xAI представили grok-code-fast-1 - скоростную и экономичную модель для агентского кодинга. Неделю доступна бесплатно в Cursor, Windsurf и других инструментах, цена через API $0.2/$1.5 за миллион токенов с кэшированием до 2 центов.
- Nvidia стартовала продажи Jetson AGX Thor за $3,499 - самой мощной платформы для робототехники с фантастической плотностью вычислений при низком энергопотреблении (2560 ядер Blackwell, 128 ГБ памяти).
- OpenAI и Anthropic ненадолго приоткрыли друг другу доступ к моделям для совместного тестирования безопасности. Claude отказывается отвечать в 70% сомнительных случаев, GPT пытается ответить почти всегда и галлюцинирует чаще.
- Sakana AI опубликовали метод M2N2 для применения эволюционных принципов к AI. Модели обмениваются параметрами, конкурируют за данные и специализируются - так можно даже обучать модели с нуля без градиентов.
- Taco Bell развернули голосовой AI на 500+ точках и выяснили: часть клиентов раздражают глюки, часть не готова говорить с машиной. Теперь допускают, что AI не должен работать повсеместно.
- Codex CLI, который теперь включен в подписку ChatGPT Plus/Pro/Team - в него добавили поддержку изображений, расширения для VSCode и автоматическое ревью пулреквестов.
- Google обновили NotebookLM: Video Overviews доступны на 80 языках, Audio Overviews стали более детальными. Неанглийские версии теперь не уступают английской по качеству обсуждения источников.
📎 Ссылки в посте:
• Продолжаем
• выпустили
• релизнули
• обнаружили
• планирует
• подали
• запустили
• представили
• стартовала
• ненадолго приоткрыли
• опубликовали
• развернули
• включен
• обновили
🏷️ Хештеги: #ReDigest
Продолжаем субботнюю рубрику, тут я кратко рассказываю про новости из мира технологий и AI, которые привлекли мое внимание.
Дайджест недели:
- Google выпустили Gemini 2.5 Flash Image (aka "nano banana") - новую модель для генерации и редактирования изображений. Главная фишка - консистентность персонажей между разными изображениями. Бесплатно в Gemini, через API $0.039 за изображение - на 95% дешевле OpenAI.
- OpenAI релизнули speech2speech модель gpt-realtime и сделали Realtime API общедоступным. Модель заточена под голосовых помощников с поддержкой MCP и инпута картинками. Цены снизили на 20%.
- Специалисты ESET обнаружили первый компьютерный вирус на основе LLM. PromptLock использует AI-агента для анализа локальных файлов, генерации персонализированных угроз и создания кода для шифрования. Пока что прототип, но тренд ясен.
- Apple планирует трехлетний перезапуск iPhone. Начнется с iPhone Air в 2025 году с собственным модемом вместо Qualcomm, продолжится складным iPhone в 2026 году с практически незаметной складкой, завершится изогнутым iPhone 20 в 2027-м.
- Илон Маск и xAI подали антимонопольный иск против Apple и OpenAI. Обвиняют в том, что интеграция ChatGPT в iOS создает антиконкурентные преимущества, а X и Grok не попадают в подборки App Store.
- Anthropic запустили превью Claude для Chrome в режиме ограниченного пилота с 1000 пользователей Max плана. Агент может выполнять задачи в браузере, но пока блокирует финансовые сайты из-за рисков безопасности.
- xAI представили grok-code-fast-1 - скоростную и экономичную модель для агентского кодинга. Неделю доступна бесплатно в Cursor, Windsurf и других инструментах, цена через API $0.2/$1.5 за миллион токенов с кэшированием до 2 центов.
- Nvidia стартовала продажи Jetson AGX Thor за $3,499 - самой мощной платформы для робототехники с фантастической плотностью вычислений при низком энергопотреблении (2560 ядер Blackwell, 128 ГБ памяти).
- OpenAI и Anthropic ненадолго приоткрыли друг другу доступ к моделям для совместного тестирования безопасности. Claude отказывается отвечать в 70% сомнительных случаев, GPT пытается ответить почти всегда и галлюцинирует чаще.
- Sakana AI опубликовали метод M2N2 для применения эволюционных принципов к AI. Модели обмениваются параметрами, конкурируют за данные и специализируются - так можно даже обучать модели с нуля без градиентов.
- Taco Bell развернули голосовой AI на 500+ точках и выяснили: часть клиентов раздражают глюки, часть не готова говорить с машиной. Теперь допускают, что AI не должен работать повсеместно.
- Codex CLI, который теперь включен в подписку ChatGPT Plus/Pro/Team - в него добавили поддержку изображений, расширения для VSCode и автоматическое ревью пулреквестов.
- Google обновили NotebookLM: Video Overviews доступны на 80 языках, Audio Overviews стали более детальными. Неанглийские версии теперь не уступают английской по качеству обсуждения источников.
📎 Ссылки в посте:
• Продолжаем
• выпустили
• релизнули
• обнаружили
• планирует
• подали
• запустили
• представили
• стартовала
• ненадолго приоткрыли
• опубликовали
• развернули
• включен
• обновили
🏷️ Хештеги: #ReDigest
#technology
RU
SAFE
Анализ ИИ
Это еженедельный дайджест новостей из мира технологий и искусственного интеллекта. Пост информативен, содержит ссылки на первоисточники и не содержит негативной информации.
64
64