AI新概念 Featured 追踪大型语言模型的思维过程 像Claude这样的语言模型并非由人类直接编程,而是通过海量数据训练而成。在训练过程中,它们会自主习得解决问题的策略。这些策略被编码在模型生成每个词语时进行的数十亿次运算中。作为模型开发者,我们惊讶地发现:我们其实并不了解模型完成大部分任务的具体机制。
AI新概念 DeepSeek-R1 API调用测评报告:国外与国内平台对比分析 DeepSeek-R1 作为当前最热门的推理大模型之一,吸引了众多云服务商接入并提供调用服务。各平台在收费方式、接口调用、用户体验以及模型响应速度等方面各有特色。本文将从国外与国内两个市场进行详细测评,帮助用户更直观地了解各平台优势和不足。
AI新概念 [译文]理解推理大型语言模型 本文介绍了构建推理模型的四种主要方法,或者说是如何增强大型语言模型(LLM)的推理能力。希望这能为您提供宝贵的见解,并帮助您在这一领域迅速演变的文献和热议中找到方向。
AI新概念 解码下一代AI:从DeepSeek突破看大模型技术演进 人工智能正在以前所未有的速度发展,而中国团队DeepSeek近期发布的两款最新模型——V3和R1,就像新一代AI的“双子星”,引领着大模型技术的新风潮。本文用通俗的语言带你了解这两款模型的核心亮点、关键技术和未来趋势。
AI新概念 [译文]这条关于 GPT-5 的传言会改变一切 如果我告诉你,GPT-5 不仅是真的,而且已经从你看不到的地方开始塑造这个世界呢?以下是我的假设:OpenAI 已经构建了 GPT-5,但他们将其留作内部使用,因为相较于向数百万 ChatGPT 用户发布,保留在内部的投资回报率要高得多。而且,这种“投资回报”并不是金钱上的。从这个角度看,结论非常简单;但要做成完整论证,需要把散落的线索穿成一条链。这篇文章会深挖我为什么认为所有细节都恰好吻合。
AI新概念 [译文]构建高效的智能体 在过去的一年里,我们与多个团队合作,构建了各种行业的大型语言模型(LLM)智能体。成功的实现案例中,最有效的实现方式并不是使用复杂的框架或专门的库,而是使用简单且可组合的模式来构建。
AI新概念 [译文] Google AI Agents 白皮书 本文适合对于 AI Agents 没有什么概念,正准备开发 Agents 的新手进行知识科普,虽然有些地方使用了google 提供的能力,整体还算比较中立。
AI新概念 [译文]AI 工程师的崛起 随着AI新能力的不断涌现,一个全新的角色正逐渐成形。为了真正驾驭这些能力,我们必须走出“提示工程师”(Prompt Engineer)的框架,不仅要亲自编写软件,还要让 AI 也具备编写软件的能力。 我们正在见证一个百年难遇的 AI 应用“右移”浪潮(shift right),其动因是基础模型(Foundation Models)所带来的新涌现能力,以及这些模型在开源或可调用 API 形态下的广泛可用性。