OpenAI押注无屏交互语音AI可实时对话设备预计明年发布

　　智东西1月5日新闻，1月1日，据外媒The Information报道，有知恋人士称，OpenAI安插于2026年第一季度推出全新的语音AI模子，而其首款齐备通过语音指令操控而非屏幕交互的局部筑设，估计仍需一年安排时代能力正式面世。

　　该筑设或为OpenAI CEO萨姆・阿尔特曼（Sam Altman）2025年11月21日访说中提及的AI硬件产物矩阵中的另一款产物。除简单产物外，OpenAI还正在规齐截整套筑设矩阵，不妨包罗智能眼镜和无屏幕智能音箱等。

　　众位ChatGPT员工泄漏，目前OpenAI的语音AI模子正在回答确凿性和反响速率上显著落伍于文本模子。为此，OpenAI正在过去两个月内整合了众个工程、产物和研商团队，对语音AI实行了一次全体重构。

　　OpenAI安插正在2026年第一季度初揭橥的全新语音AI模子，将正在音质、延迟和交互体例进取一步迫临实正在对话体验，以至也许正在用户讲话的同时实行语音播报，展现更亲昵“对话伙伴”的形态。

　　回头OpenAI正在语音对象上的技巧演进，2022年其推出的Whisper是一套以高确凿率著称的主动语音识别（ASR）体系，首要管理“听懂人说线年，OpenAI进一步揭橥了GPT-realtime语音转语音模子，劈头索求低延迟、接续对话式的语音交互。这一系列考试，也为当前全新一代语音AI模子的架构重塑奠定了根基。

　　The Information报道称，OpenAI正在语音AI模子上的修正已初睹成绩。新一代模子正在架构层面实行了调剂，也许天生听感更自然、情感更丰裕的语音回答，同时正在解答深度和确凿性上也有显著擢升。

　　与现有模子比拟，新的语音AI模子能够达成与用户“同步讲话”，并正在对话中更好地应对打断和插话。这种及时、接续的语音交互才力，是此刻语音AI模子尚未具备的。

　　值得小心的是，驱动语音AI模子的底层大型说话模子，与领先驱动ChatGPT文本回答的模子并不齐备不异。

　　正在团队装备上，语音AI项目标枢纽负担人之一是昆丹·库马尔（Kundan Kumar）。他是一名语音AI研商员，于本年夏季从环球AI伴随行使“一哥”、美邦AI闲话呆板人独角兽公司Character.AI参预OpenAI，负担主导闭系使命。

　　其余，项目重点成员还包罗产物研商主管本·纽豪斯（Ben Newhouse），他曾激动OpenAI将正本面向文本AI的根基措施重构为赞成语音模子，众模态ChatGPT的产物司理杰基·香农（Jackie Shannon）。

　　OpenAI的研商职员正正在同步胀动一款语音驱动的局部筑设，其重点思念是让用户通过语音而非屏幕与AI交互。

　　据知恋人士泄漏，本年夏季，插手该筑设研发的研商职员曾向内部员工出现闭系构念：这款AI语音筑设将更像是一个与用户并肩使命的伙伴，也许主动供给提议，助助用户完毕目的，而不单仅是行使顺序或软件的语音入口。

　　正在得回用户授权的条件下，该筑设可通过语音和视频感知方圆情况及用户自己形态，从而供给更具情境感知才力的任事。

　　目前，已有众名OpenAI员工插手到与该筑设闭系的差异闭节中，包罗供应链执掌、工业打算以及模子研商等。

　　正在硬件打算层面，据此前智东西报道，OpenAI于2025年5月21日以近65亿美元（约合群众币455亿元）的价钱收购了io公司，io团队的大局限成员（约55人）参预OpenAI。io公司由前苹果首席打算官乔纳森·艾维（Jony Ive）共同创立，负担为OpenAI打算这款全新的AI硬件产物。

　　众位知恋人士还泄漏，OpenAI并不野心只推出简单筑设，而是安插分阶段揭橥一系列产物，内部磋商过的样子包罗智能眼镜以及齐备无显示屏的智能音箱。

　　The Information的报道中提到，OpenAI的研商职员正正在拓荒这款语音驱动的局部筑设，是祈望用户通过语音而非屏幕实行交互。

　　这一思绪正在Al研商界并非个例。包罗Thinking Machines Lab正在内的不少研商机构都以为，语音是人类最自然的交换体例，人机交互也应回归这一样子。

　　然而，一位前OpenAI员工提到，目前的实际寻事正在于，多量ChatGPT用户并不民风运用语音成效。源由既不妨是语音体验尚不行熟，也不妨是局限用户根基不明确ChatGPT赞成语音交互。

　　正在OpenAI的筑设设念中，“无屏幕”被视为一项首要打算对象。局限业内人士以为，这种样子有助于消重用户对筑设的成瘾水平。

　　乔纳森·艾维目前正深度插手OpenAI的硬件研发。他曾提到，对他而言，插手这类项目至闭首要，由于他以为将来的新型筑设，恐怕是修复过去消费电子产物所带来题目的一种体例。

　　与谷歌、亚马逊、Meta、苹果等科技巨头相似，OpenAI也正在主动结构新一代局部AI筑设，包罗可穿着产物。正在这些公司看来，此刻最主流的筑设样子——如iPhone——并未真正为将来的AI才力而打算，而这恰是下一轮硬件立异的冲破口所正在。

相关文章