首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:字节重磅推出豆包视觉理解模型;AI“魔改”宠物跳舞爆火;OpenAI开放满血o1模型API;即梦AI上线海报生成功能

2024-12-18 15:38 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、字节推出豆包视觉推理大模型:价格低至0.003元/千token

在火山引擎FORCE原动力大会上,火山引擎总裁谭待发布了豆包视觉理解大模型,该模型通过结合文本和图像信息,展现出卓越的内容识别和推理能力。新模型的价格大幅降低,使得企业用户在智能化转型中更具信心。豆包大模型的日均tokens使用量已超过4万亿,显示出强大的市场需求和应用潜力。

image.png

【AiBase提要:】

🖼️ 新推出的豆包视觉理解大模型能同时处理文本和图像信息,提升内容识别和推理能力。

💰 自今年5月以来,豆包大模型的行业价格降低了99%,使企业用户更易于应用该技术。

📈 目前豆包大模型的日均tokens使用量超过4万亿,增长超过33倍,显示出其市场需求。

2、OpenAI开放满血o1模型API:成本降低60% 新增高级视觉处理能力

在为期12个工作日的连续直播活动中,OpenAI在第9天面向开发者发布了o1模型的API,并宣布对实时API进行重大升级,支持WebRTC技术。自发布日起,OpenAI将向API使用等级5级的开发者提供o1API的访问权限。此次更新的o1模型API相较于之前的预览版本,在思考成本上实现了60%的降低,并新增了高级视觉处理能力。同时,GPT-4o在音频处理上的成本也减少了60%,而mini版本的价格也大幅下降了10倍。

【AiBase提要:】

🚀 o1模型API发布,支持WebRTC技术,提升实时交互能力。

💰 成本降低60%,新增高级视觉处理能力,提升用户体验。

📈 周活跃用户超3亿,显示出OpenAI用户基数的快速增长。

3、Ideogram推出批量图像生成工具:告别繁琐操作,大规模创意图像一键生成

AI图像生成平台Ideogram近期推出了一项批量图像生成工具,旨在通过上传表格文件简化图像生成流程。用户可以在CSV文件中预先填写提示词和设置,Ideogram将根据这些信息自动生成图像。这一创新大幅提高了专业设计师和创意人士的工作效率,减少了逐条输入的繁琐操作。该功能目前仅对Ideogram Pro用户开放,展现了AI在设计领域的巨大潜力和智能化的创作方式。

image.png

【AiBase提要:】

🚀 批量生成工具允许用户上传包含提示词的表格,简化图像生成流程。

🖼️ 用户只需下载模板、生成提示词并上传CSV文件,即可自动生成图像。

💼 该功能目前仅对Ideogram Pro用户开放,为设计师提供了高效的创作体验。

4、即梦AI上线海报生成功能 可一键将静态海报变为动态海报

即梦AI在2024年12月18日的火山引擎FORCE大会上推出了全新的海报生成功能。这项技术的发布标志着图像生成领域的一次重要进步。用户只需输入一句简单的描述,系统便能快速生成创意海报,大幅简化了传统设计所需的时间与技能要求。此外,新增的动态海报生成功能为内容创作者提供了更丰富的展示方式,尤其适合社交媒体和广告使用,能够有效吸引观众注意力,提升营销效果。

image.png

【AiBase提要:】

🌟 用户只需一句描述,即可快速生成创意海报,简化创作过程。

🎥 新增动态海报生成功能,让作品展示更生动,适合社交媒体和广告使用。

📈 即梦 AI 考虑用户个性化需求,提供灵活的内容生成选项,助力品牌推广。

5、扣子1.5版正式推出:支持多模态能力 可第一时间体验豆包新模型

扣子Coze在火山引擎FORCE原动力大会上推出了全新版本的扣子1.5,标志着在AI应用开发领域的重要进展。此版本支持GUI搭建界面,用户可轻松创建和发布多种应用形式,极大地降低了开发门槛。同时,扣子1.5增强了多模态能力,支持最新的豆包大模型,提供丰富的模板和解决方案,助力开发者提升效率,已吸引了超过100万活跃开发者。

image.png

【AiBase提要:】

🖥️ 扣子1.5支持GUI搭建界面,用户可一键发布多种应用形式,降低开发门槛。

🌐 多模态能力显著增强,支持豆包视觉理解、音乐和图像生成模型,扩展AI应用范围。

📊 提供海量精品模板,覆盖多业务场景,提升开发效率,吸引了超过100万活跃开发者。

详情链接:https://www.coze.cn/docs/guides/vlm

6、字节跳动:豆包视频生成模型将于2025年1月正式对外开放服务

在2024火山引擎FORCE原动力大会·冬上,火山引擎展示了豆包大模型家族的全新升级,日均tokens使用量超4万亿,增长显著。大会推出了视觉理解模型及多个模型的升级,提升了豆包通用模型pro的综合任务处理能力。此外,火山引擎发布了支持AIGC创作的veOmniverse+豆包·3D生成模型,并宣布豆包·视频生成模型将于2025年1月正式对外开放服务,标志着大模型技术的深入发展。

image.png

【AiBase提要:】

🌟 豆包大模型日均tokens使用量超过4万亿,增长超过33倍,显示出广泛应用。

🛠️ 新发布的veOmniverse+豆包·3D生成模型支持高保真3D资产生成和编辑,提升AIGC创作能力。

📅 豆包·视频生成模型将于2025年1月正式对外开放服务,用户可预约体验。

7、字节跳动火山引擎全域AI搜索发布:支持多模态搜索

在2024火山引擎FORCE原动力大会·冬上,字节跳动推出了全域AI搜索服务,旨在通过整合多种信息和需求,提升企业的推荐精准度和信息发现能力。该服务依托强大的A1搜推引擎,支持多模态理解,能够快速处理海量内容并提供实时热点答案,增强用户体验。同时,火山引擎还推出了大模型记忆方案,助力客户构建高效的记忆系统,这是大模型发展的重要方向。

image.png

【AiBase提要:】

🌐 火山引擎全域AI搜索整合了场景化搜索、企业私域信息和联网问答服务,提升信息推荐的精准性。

⚙️ A1搜推引擎利用豆包大模型家族的技术,支持文本、图像、音频和视频等多模态理解,适用于多种应用场景。

💡 大模型记忆方案结合上下文缓存和RAG技术,帮助客户构建有效的记忆系统,提升大模型的记忆能力。

8、微信上线“作者朗读音色”新能力

微信平台推出的“作者朗读音色”功能,允许公众号作者用个性化语音为文章配音,提升了阅读体验的互动性和个性化。作者需下载“订阅号助手”APP录制语音,复刻个人语气和情感,并可在公众号中应用。此功能目前处于灰度测试阶段,尚未全面开放,微信鼓励创作者耐心等待。此举标志着微信在提升用户体验和满足创作者需求方面的重要进展,预计将丰富公众号内容表现形式。

微信截图_20241218142646.png

【AiBase提要:】

🎧 作者可通过个性化语音为文章配音,增强互动体验。

📱 需要下载“订阅号助手”APP录制语音,复刻个人风格。

🔄 功能目前处于灰度测试阶段,尚未全面开放。

9、英伟达发布生成式AI超级电脑:仅249美元 性能提升1.7倍

英伟达推出的Jetson Orin Nano Super是一款面向开发者的生成式人工智能超级电脑,定价249美元,性能提升显著,适用于多种AI应用场景。该设备在生成式AI性能上提升了1.7倍,并且在内存带宽和运算能力方面也有显著进步。黄仁勋强调,该设备以更低的成本为开发者提供卓越的运算性能,展现出在智慧城市、农业及机器人开发等领域的广泛应用潜力,标志着AI技术的普及与应用迈出了重要一步。

image.png

【AiBase提要:】

🚀 性能提升:Jetson Orin Nano Super的生成式AI性能提升了1.7倍,内存带宽提高50%。

💰 亲民定价:该设备定价为249美元,适合开发者使用,降低了AI技术的门槛。

🌍 广泛应用:支持多种功耗场景,适用于智慧城市、农业和机器人等多个领域。

10、OpenAI表态:暂未计划推出 Sora API,视频生成需求超预期

OpenAI最近宣布,暂时没有推出其视频生成模型Sora的API计划,原因在于用户需求远超预期。Sora能够根据文本或图像生成逼真视频,但由于申请用户激增,OpenAI不得不暂停新用户注册。CEO山姆·阿尔特曼对此表示歉意,并强调解决这一问题需要时间。与此同时,竞争对手谷歌和AWS已推出各自的视频生成API,OpenAI面临着市场压力,未来的策略备受关注。

image.png

【AiBase提要:】

🌟 OpenAI表示暂无Sora API推出计划,因需求远超预期。

📈 Sora因用户申请激增而暂时关闭注册,CEO对此表示歉意。

🤖 谷歌和AWS等竞争对手已推出视频生成API,OpenAI面临压力。

11、AI“魔改”宠物跳舞爆红网络:猎奇、荒诞成流量密码

近期,AI生成的宠物跳舞视频在抖音上引发热潮,展现出荒诞与搞笑的完美结合。这些视频中的猫狗们瞬间化身舞蹈高手,带来了强烈的视觉冲击和戏剧性。尽管部分观众对这种奇特的视觉体验感到不适,但它们无疑挑战了我们对动物形象的固有认知,展示了AI技术的无限可能性与创意。

image.png

【AiBase提要:】

🎉 AI生成的宠物舞蹈视频在抖音迅速走红,播放量已达8.8亿次。

😹 视频中的宠物展现出超现实的舞蹈动作,打破了传统认知,带来强烈的视觉冲击。

🤖 这些视频不仅是技术的展示,更是娱乐和创意的新维度,挑战了人们对动物形象的理解。

12、不需要喂食也能陪伴你 AI宠物Moflin在小红书走红

Moflin是一款新型AI宠物,因其可爱的外形和情感互动特性在小红书上迅速走红。用户通过视频分享与Moflin的互动体验,吸引了众多网友的关注。尽管Moflin无法替代真实宠物,但其提供的情感陪伴满足了现代人的需求,成为一种新的消费趋势。Moflin的情感模拟和个性化互动使其在市场上具备了巨大的溢价空间,成为一种新型的情感陪伴产品。

image.png

【AiBase提要:】

🐾 Moflin是一款情感互动的AI宠物,外形可爱,吸引了大量网友关注。

💰 其售价为2832人民币,上市后迅速售罄,显示出强大的市场需求。

❤️ Moflin通过模拟情感与用户互动,满足了人们对情感陪伴的需求。

详情链接:https://www.moflin.com/

13、波士顿动力裁员5%,因资金压力急需转型

波士顿动力公司近期宣布裁员5%,约45名员工受到影响,几乎涵盖所有部门。公司面临严峻的财务压力,尽管其机器人产品如Spot和Atlas在市场上受到关注,但商业发展未达预期。CEO罗伯特・普莱尔指出,资金消耗速度超过收入增长,迫切需要优化运营以实现可持续发展。在竞争激烈的市场环境中,波士顿动力需应对特斯拉等公司的压力,转型成为当务之急。

【AiBase提要:】

🦾 波士顿动力裁员5%,约45名员工,涉及几乎所有部门。

💰 公司面临资金消耗过快的问题,迫切需要精简运营以实现可持续增长。

🤖 市场竞争加剧,波士顿动力需应对来自特斯拉等公司的压力,且难以将媒体关注转化为盈利。

14、数百名OpenAI员工即将通过私人股票出售获得1000万美元巨额收益

最近,OpenAI宣布将为软银进行16亿美元的股票回购,数百名现任及前任员工将有机会通过这一交易获得高达1000万美元的收益。这一消息引发了广泛关注,尤其是对于那些早期加入公司的员工而言,他们可能会实现财务自由。此次股票出售不仅激励了员工,也加强了公司与投资者之间的信任关系,显示出OpenAI作为创新型公司的潜力与价值。

【AiBase提要:】

💰 数百名现任及前任 OpenAI 员工将有机会通过股票回购获得高达1000万美元的收益。

📈 OpenAI 为软银提供的16亿美元股票回购提议吸引了广泛关注。

🤝 此次股票出售不仅激励员工,也增强了公司与投资者之间的信任关系。

举报

  • 相关推荐
  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • 厚植AI创新沃土!麒麟信安打造人工智能孵化器,赋能创业梦想

    10月28日,麒麟信安人工智能孵化器在长沙启动,旨在汇聚AI领域人才、技术与资本,构建开放协同的创新生态。该项目获湖南省多部门支持,已吸引60余个项目入围,组建了首批30余位专家导师团,并与多家顶尖机构共建联合体,通过政策扶持、资本对接等多维度赋能,培育优质AI项目在湘落地发展,助力区域打造人工智能产业创新高地。

  • 卖家精灵加入中国人工智能产业发展联盟(AIIA),加速AI赋能跨境电商

    卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力,近日正式加入中国人工智能产业发展联盟(AIIA),成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可,未来将携手联盟推动AI技术研发与产业化,助力中国品牌全球化。依托八年积累的海量电商数据与算法体系,卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案,服务超百万跨境卖家,显著提升运营效率与决策精准度。

  • 行业首个!海尔冰箱获ISO/IEC 42001人工智能管理体系认证

    2025年10月,海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业,标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程,确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品,推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术,为用户提供更安全、智能的健康饮食体验。

  • 人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

    科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲,强调高质量数据集是人工智能产业决胜关键。他指出,算力、算法和数据构成AI三大要素,而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施,通过集中管理、分散赋能模式,打通数据采集、治理到AI训练全链路,推动产业智能化升级。该平台已在制造、金融等领域落地,助力企业释放数据要素价值,实现弯道超车。

  • “大模型应用”新风口:“无人测试”趋势,CIO/CTO如何应对

    当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈,而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试,可提升测试效率300%、降低成本30%,并将产品发布周期从"月"压缩至"周"。这不仅是技术升级,更是重构IT成本结构、实现降本增效的战略支点,助力IT部门从成本中心转型为价值创造中心。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

今日大家都在搜的词: