10 月 29 日 - 30 日,豆包接连发布重大升级,涵盖编程、配音、图像创作、语音互动等多个核心场景,具体包括:
豆包编程正式上线创作与问答双模式,大幅降低编程门槛,零基础用户也能高效完成开发任务。创作模式:新增参考图和画板功能,用户可通过自然语言描述、上传参考图或绘制流程图、线框图表达需求,由豆包编程 Agent 自动规划并调用工具,生成内容充实的网页。平台提供多场景灵感模板,支持实时预览、可视化编辑、局部代码快速更新,还能自动记录修改历史,方便用户随时切换版本。生成的作品可一键分享或下载代码,历史作品可在 “我的应用” 中可视化管理。
-
问答模式:聚焦专业编程场景,支持多附件提问,能准确理解复杂上下文,配备沉浸式代码阅读器与划词问答功能。代码运行出错时,可自动分析错误信息并提供修复建议或直接修复,同时支持一键运行代码。
-
核心优势:实现 “PPT 式拖拽 + 多 Agent 全自动协作”,零代码用户 8 分钟可生成可上线 H5 或数据看板;支持 Python、Java、HTML 等多语言代码生成,可一键上传本地代码文件或导入 GitHub 仓库,AI 自动分析项目结构并生成关联代码与注释;内置多语言运行环境,支持代码调试与 AI 智能纠错,还能为学习者生成分步教程与可运行代码,覆盖从基础语法到项目实战的全流程学习需求。
豆包语音团队发布 “AI 多人有声剧” 自动化方案,推出全自动多人配音系统,实现从小说文本到高质量多人有声剧成品的端到端全自动生产,无需人工参与。
-
核心能力:角色识别准确率达 98%,可自动完成多角色划分;基于高自然度多角色智能朗读技术,语音大模型通过海量文本与语音的多模态预训练,具备强大的文本理解能力和语音演绎能力,演播效果发音自然、情感丰富。
-
后期自动化:AI 可自动添加音乐、音效、特效并进行智能混音,画本预测模型能从小说文本生成带有音效、人声特效、环境音、配乐的画本信息,再通过音频召回与合成、智能动态调整音频参数,最终合成媲美真人水准的有声剧作品。
-
落地应用:首批通过该方案创作的作品已在番茄小说 APP 上线,获得良好用户反馈,显著提升听书自然度与沉浸感,同时大幅降低制作成本、缩短制作周期。
-
图像创作升级:全新上线 Seedream4.0 生图模型,支持文生图、多图参考及精细化图像编辑,可轻松生成符合需求的视觉内容。
-
情景语音互动:语音通话功能新增情感化交流模式,可模仿影视声音讲笑话、用方言聊天,还能化身专属英语陪练。
-
专业内容生成:上线 AI 播客功能,输入文本即可一键生成带插话、附和的双人对话式播客节目。
-
体验优化:优化深度思考模式,延长上下文承载能力,复杂问题分析更连贯全面;提升视频生成模型效果,输出 1080P 高清内容,动态画面更流畅自然;修复部分场景闪退问题,降低操作延迟,整体运行稳定性显著增强。