blog | 星途引航

Step-Audio 首个产品级开源语音交互模型

Step-Audio——语音交互模型，它是阶跃星辰团队搞出来的首个产品级开源模型，简直就是语音交互界的“宝藏神器”。它不仅能实现语音识别、对话、合成这些基本操作...

资讯

11个月前

字节跳动的AGI野心

“探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个Scaling（规模）”，1月23日，知情人士向北京商...

科技

1年前 (2025)

AI将重塑工作方式，推动科研与生活全面革新

微软近期在其官方平台上揭示了2025年人工智能领域的六大关键预测，为我们描绘了一幅未来科技生活的生动画卷。这些预测不仅涵盖了AI技术的飞跃，还深入探讨了A...

资讯

1年前 (2025)

2025 AI深度前瞻：推理成本暴降90%

走出最后一个AI寒冬，21世纪第三个十年见证了现代AI的诞生。斯坦福大学教授、“AI教母”李飞飞将当前AI领域的变化描述为科技领域的“寒武纪大爆发”。回顾过去一...

科技

1年前 (2025)

OpenAI发布o1正式版，解锁图像识别

OpenAI 发布的 o1 正式版解锁了多模态图像识别功能，具有以下特点和影响：功能特点图像识别与分析：能够准确识别图像中的内容，例如可以从一张手...

资讯

1年前 (2025)

ChatGPT高级语音助手正式上线！

在首次向公众展示的四个月后，OpenAI终于要面向其所有付费用户开放ChatGPT的类人高级人工智能（AI）语音助手功能——“高级语音模式”（Advanced Voice Mode，以...

资讯

1年前 (2024)

大模型到底是什么？

大模型发展到现在已经有一段时间了，不少人都有自己亲身体验过，昨晚上 OpenAI 还发布了最新的草莓模型。但依然有不少人不明白大模型是什么。这篇文章，作者...

科技

1年前 (2024)

OpenAI o1-mini 向免费用户开放

OpenAI 展示了其最新的大型语言模型（LLM）--OpenAI o1及其小兄弟 OpenAI o1-mini。该公司在公告中称，Plus 和 Team 用户可在公告发布之日起访问该模型。企业...

资讯

1年前 (2024)

Basic Reflection，AI Agent的左右互搏之术

通过实际源码详细介绍了Basic Reflection模式的实现方法，包括构建Generator和Reflector的过程。阅读本文可以帮助读者更好地理解Basic Reflection的概念和实...

科技

1年前 (2024)

AI 视觉创作工具 WHEE 试用体验：平均水平以上

WHEE 是美图旗下一款 AI 绘画与图片生成应用。这款应用以其强大的 AI 能力和丰富的创作功能，为用户提供了令人眼前一亮的视觉创作体验。在简单体验后，以下是...

科技

1年前 (2024)

Step-Audio 首个产品级开源语音交互模型

字节跳动的AGI野心

AI将重塑工作方式，推动科研与生活全面革新

2025 AI深度前瞻：推理成本暴降90%

OpenAI发布o1正式版，解锁图像识别

ChatGPT高级语音助手正式上线！

大模型到底是什么？

OpenAI o1-mini 向免费用户开放

Basic Reflection，AI Agent的左右互搏之术

AI 视觉创作工具 WHEE 试用体验：平均水平以上

热门标签

站点公告