首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:OpenAI全面开放Canvas功能;豆包电脑版视频生成功能内测;全球首个AI程序员Devin开放使用

2024-12-11 15:26 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI发布Canvas工具 提高ChatGPT写作和编码效率

OpenAI于12月11日推出Canvas功能,旨在提升ChatGPT用户在写作和编码项目中的效率。Canvas作为一个新界面,专注于处理需要编辑和修改的内容,用户可以通过多种方式进入Canvas并利用其丰富的快捷键和功能。此功能不仅支持Python代码执行,还允许用户定制GPT,增强人机协作体验。

image.png

【AiBase提要:】

🖥️ Canvas功能现已向所有ChatGPT用户开放,支持网页版及Windows应用,Mac和移动平台即将推出。

🔧 用户可通过多种方式进入Canvas,享受快捷键和Python代码执行等功能,提升工作效率。

💬 Canvas支持定制GPT和评论功能,用户可获得反馈和编辑建议,促进人机协作。

2、豆包电脑版视频生成功能开启内测 每日可免费生成十支视频

字节跳动旗下的豆包电脑版视频生成功能现已开启内测,部分用户已获得体验资格。用户可以通过内测申请,访问doubao.com,利用视频生成功能上传图片并输入提示词,结合运镜和分镜信息生成视频内容。内测期间,用户每天可免费生成十支视频。

image.png

【AiBase提要:】

🆕 内测功能现已开放,部分用户获得体验资格。

📸 用户可上传图片并输入提示词生成视频,每天可免费生成十支。

🔧 字节跳动未来将优化该功能,帮助更多用户进行创作。

3、DeepSeek AI 发布新版 DeepSeek-V2.5-1210:数学、编程与写作能力大幅提升

DeepSeek AI最近推出了DeepSeek-V2.5-1210,这是其增强版本,旨在提升AI在数学、编程、写作和推理任务中的表现。新版本通过改进核心功能和优化算法,显著提高了模型的可靠性和易用性。数学任务完成率从74.8%提升至82.8%,实时编码得分提高至34.38%。

image.png

【AiBase提要:】

🔢 数学任务完成率提升至82.8%,显示出强大的数学问题解决能力。

💻 实时编码得分提高至34.38%,在实时编码任务中表现显著进步。

📝 改进后的写作和推理能力使模型在撰写论文和逻辑分析中表现出色。

详情链接:https://huggingface.co/deepseek-ai/DeepSeek-V2.5-1210

4、Adobe联手MIT打造CausVid视频生成模型,首帧延迟仅1.3秒!

CausVid是Adobe与MIT合作推出的一款革命性视频生成模型,能够以每秒9.4帧的速度实时生成高质量视频,首帧延迟仅1.3秒。这项技术突破了传统视频生成模型的速度限制,为游戏、虚拟现实和流媒体等领域带来了前所未有的可能性。CausVid采用了创新的因果生成方式和不对称蒸馏技术,显著提升了生成效率。

image.png

【AiBase提要:】

⚡ CausVid以每秒9.4帧的速度实时生成视频,首帧延迟仅1.3秒,极大提升了视频生成效率。

🛠️ 采用因果生成方式和不对称蒸馏技术,CausVid能快速预测下一帧内容,减少计算开销。

🎮 支持多种视频生成任务,包括文本到视频、图像到视频等,推动游戏和虚拟现实等领域的创新。

详情链接:https://causvid.github.io/

5、视觉中国与生数科技Vidu合作 将开发AI视频内容生成解决方案

近日,视觉中国与北京生数科技有限公司建立战略合作关系,旨在共同探索视觉产业大模型平台及应用,推动人工智能在视觉内容产业的深入应用。通过这一合作,双方将整合视觉中国丰富的版权合规资源与生数科技的多模态大模型技术,为内容创作者提供更高效的服务。

【AiBase提要:】

📈 双方将共同探索视觉产业大模型平台,推动产业智能化升级。

🤝 视觉中国提供丰富的视觉内容资源,生数科技投入多模态大模型技术。

🌍 共同开拓国内外市场,开发针对用户需求的AI视频生成应用。

6、AI对话类产品或面临天花板字节提升即梦剪映优先级

豆包的用户规模在增长,但活跃度和使用时长仍面临挑战。字节高层认为问题在于文本AI对话产品的天花板,因此决定将资源投入到低交互门槛的多模态AI产品中,如即梦和剪映。即梦作为AI创作平台,吸引了大量创作者,而剪映的用户数也在不断增加。

【AiBase提要:】

📉 豆包的用户活跃度不高,平均每周仅活跃2至3天,使用时长仅约10分钟。

💡 字节决定将资源投入即梦等低交互门槛的多模态AI产品,以提升商业化潜力。

📊 猫箱的用户平均对话轮数是豆包的近50倍,显示出低交互门槛产品的吸引力。

7、全球首个AI Agent程序员Devin全面开放使用,月费高达500美元

全球首个AI程序员Devin正式开放使用,月费500美元引发热议。虽然其功能强大,能够自动化编码和提升团队协作效率,但高昂的价格让小团队和个人用户难以承受。许多网友呼吁推出更友好的个人订阅模式,以满足不同用户的需求。

image.png

【AiBase提要:】

🌐 Devin的月费高达500美元,成为市场上最贵的生成式AI产品之一。

👥 网友呼吁推出个人订阅模式,认为当前价格对小团队和个人用户不友好。

⚙️ Devin具备强大的自动化编码能力,并在团队协作中表现优异,可以显著提升开发效率。

Devin 的体验地址: app.devin.ai

8、Solos发布AI眼镜AirGo Vision:集成ChatGPT 支持语音指令功能

Solos最近推出的AirGo Vision智能眼镜,标志着智能穿戴设备的新时代。这款眼镜集成了ChatGPT人工智能和高清摄像头,不仅提升了用户体验,还支持语音指令功能,允许用户通过自然语言与设备互动。

image.png

【AiBase提要:】

📸 AirGo Vision是首款搭载ChatGPT和摄像头的智能眼镜,提升用户体验。

🤖 具备语音指令功能,用户可通过自然语言与设备进行互动。

🌐 未来将集成健康监测和导航等更多实用功能,增强智能眼镜的应用场景。

9、面壁智能获新一轮数亿元融资 将提速端侧等大模型商业化布局

北京面壁智能科技有限责任公司近期完成数亿元融资,旨在加速端侧AI大模型的商业化布局。此轮融资由多家投资机构联合领投,面壁智能计划利用资金提升其高效大模型服务,致力于在行业中创造可感知的价值。

image.png

【AiBase提要:】

💰 本轮融资数亿元,由多家投资机构联合领投,资金将用于加速端侧AI大模型的商业化布局。

📈 面壁小钢炮MiniCPM凭借高效低成本的优势,成为全球开源社区的明星项目,下载量突破300万。

🤝 公司与华为、百度等行业标杆企业合作,推动端侧智能在消费电子和新兴硬件中的应用。

10、YouTube 扩展 AI 自动配音功能,数十万创作者受益

YouTube最近宣布将其人工智能驱动的自动配音功能扩展到数十万个频道,特别是针对知识和信息类内容。这一功能旨在提升视频的传播范围,并吸引更多不同语言的观众。创作者在上传视频时,系统会自动生成配音版本。

image.png

【AiBase提要:】

🌐 数十万个频道已获得AI自动配音功能,专注于知识和信息类内容。

🎤 创作者可在发布前预览配音,并有权取消或删除不满意的版本。

🤖 YouTube承诺将持续改善配音质量,尽管目前仍存在不完美之处。

11、OpenAI CFO:特朗普或成为 “AI总统”,相信马斯克会优先考虑国家利益

在纽约举行的 Reuters NEXT 大会上,OpenAI CFO Sarah Friar 表示,唐纳德·特朗普可能成为这一代人工智能的总统,正值人工通用智能(AGI)发展的关键时期。她对特斯拉创始人埃隆·马斯克表示信任,认为他会优先考虑国家利益。

【AiBase提要:】

🌟 特朗普可能成为 “人工智能时代的总统”,将于 AGI 关键时期上任。

🤖 OpenAI 的 Sora 工具需求激增,目前账户注册已暂停,旨在更好地收集反馈。

📈 ChatGPT 用户数量迅速增长,从200万激增至300万,反映出市场对新推理模型的强烈需求。

12、AI安全警报!Claude设备控制功能遭黑客突破,引发安全担忧

近日,Anthropic公司推出的Claude AI的Computer Use功能被发现存在严重安全漏洞,网络安全专家Johann Rehnberger揭示了通过简单的提示词注入,AI能够被诱导下载并运行恶意软件。这一漏洞不仅影响Claude,还波及其他AI聊天机器人,提醒我们在AI安全问题亟需关注。

【AiBase提要:】

🔍 研究人员发现Claude AI的Computer Use功能存在提示词注入漏洞,可能导致恶意软件下载。

💻 此漏洞利用方式被命名为ZombAIs,攻击者可诱导AI编写和运行恶意代码。

⚠️ Anthropic公司已提醒用户采取预防措施,避免Claude与敏感数据和操作直接接触。

举报

  • 相关推荐
  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • 必应引入OpenAI的Sora视频生成器,完全免费使用

    微软表示:“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信,创造力应当轻松且人人可用,从而助力你的探索与表达。”

  • AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

    本文汇总了AI领域最新动态:1)腾讯开源数字人模型HunyuanVideo-Avatar,支持图像转视频创作;2)Trae国际版开启付费订阅,首月3美元;3)Claude网页搜索功能向免费用户开放;4)印度AI初创Builder.ai破产,亏损超5亿美元;5)腾讯元宝接入微信读书平台;6)快手计划加大AI投入但预计影响利润率;7)Mistral推出智能代理API;8)Claude移动端上线语音对话测试版;9)OpenAI拟推ChatGPT第三方登录功能;10)掘金发布AI项目一键部署工具;11)多模态模型视觉推理能力评估显示准确率仅25.8%;12)中石油发布3000亿参数昆仑大模型,推动油气产业智能化。

  • 如何用豆包音乐生成功能创作AI歌曲?

    本文介绍如何利用豆包AI工具进行音乐创作。用户可通过APP或网页端(https://www.doubao.com/chat)使用该功能,按照固定句式输入创作需求:包括歌曲主题、音乐风格(如民谣、流行)、表达情绪(快乐、怀旧等)及音色选择(男声/女声)。系统会根据指令自动生成歌词并配乐,用户可即时查看歌词内容和播放生成的音乐。操作流程简单:打开豆包→选择音乐生成功能→填写创作指令→提交等

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

    超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。