首页 > 业界 > 关键词  > Krea最新资讯  > 正文

AI日报:效果炸裂!Krea Video向所有人开放;阿里花8亿入股Kimi;Arc Search可以打电话了;腾讯智影声音大模型升级

2024-05-24 15:34 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Krea AI视频生成工具向所有人开放

Krea AI最近宣布Krea Video视频生成工具已对所有人开放,进入公测阶段。该工具结合关键帧和文本提示,提供灵活视频创作方式。用户可调整关键帧、文本提示、视频持续时间和纵横比,制作多样化视频。生成过程分为预览和增强两阶段,可随时取消。Krea Video为视频创作者提供简单高效的创作工具。

image.png

【AiBase提要:】

⏳ 灵活创作:结合关键帧和文本提示,用户可调整视频外观和内容

🔄 多样化效果:调整纵横比、移动效果,制作循环播放视频

🚀 高效生成:分预览和增强阶段,随时取消生成过程

产品入口:https://top.aibase.com/tool/krea-video

详情:https://www.chinaz.com/2024/0524/1618876.shtml

2、腾讯智影宣布声音模型大升级

腾讯智影宣布声音模型大升级,新版本声音更加自然连贯,具有更丰富的语调和情感,减少了语音瑕疵的出现概率,并能更好地适应不同文本内容和语境。智影推出两款免费新音色,适用于对话闲聊场景。声音定制效果也升级,让用户在创作配音作品时体验更加优质的声音效果。

【AiBase提要:】

🔊 更自然流畅,语调情感更丰富,减少语音瑕疵

🎙️ 推出热情似火的女声和可爱亲切的女声音色

🎧 声音定制效果升级,采样率从16K升级到24K

3、Arc Search推出全新功能CALL ARC

Arc Search最近推出了一个全新的功能——CALL ARC,允许用户通过自然语言的方式随时随地获得问题的答案。这一功能极大地方便了用户在各种场景下快速获取信息的需求。用户可以通过Arc Search随时随地获取所需信息,享受科技带来的便利和乐趣。

image.png

【AiBase提要:】

🔍 Arc Search推出CALL ARC功能,用户可以通过自然语言获得问题答案,方便快捷。

📱 CALL ARC可通过Siri Ultra进行操作,适用于Apple生态系统设备,无需额外应用。

✉️ CALL ARC功能提升了灵活性和实用性,用户可保存笔记、发送消息,改变信息获取方式。

4、阿里投资Kimi AI 开发商月之暗面8亿美元 持股36%

阿里巴巴集团在2024财年投资月之暗面(Moonshot AI)约8亿美元,持股36%,强调人工智能对业务增长和变革的核心作用。公司高层表示,AI将带来前所未有的机遇和挑战,推动企业创新和价值创造。AI不是威胁,而是驱动力,未来十年将颠覆各行业,要跟上AI的进步才能不被取代。

【AiBase提要:】

🚀 阿里首次披露对月之暗面投资情况,投资约8亿美元持股36%。

💡 阿里高层认为AI是业务增长和变革的核心力量,将为企业带来机遇和挑战。

💰 AI部署将增加计算需求,推动阿里云增长,AI作为用户体验和商业模式的驱动力将带来巨大机遇。

5、AI图案生成器Ideogram Tile

Ideogram Tile是一款AI生成的图案生成器,能够从文本提示中创建无缝重复的图案,为设计师、艺术家和企业开辟了无限可能。这一新功能的推出标志着AI驱动设计行业迈出了重要一步。

image.png

【AiBase提要:】

⭐ Ideogram Tile让用户可以轻松生成复杂的墙纸、沉浸式景观和无尽的纹理,无需专业设计技能。

⭐ Ideogram Tile的推出意味着AI驱动设计行业迈出了重要一步,激发了室内设计、时尚和游戏等多个领域的新创意方向。

⭐ Ideogram Tile的推出进一步巩固了公司在生成AI领域的先驱地位,为未来的创新奠定了基础。

详情链接:https://top.aibase.com/tool/ideogram-ai

6、Pandora:根据自然语言指令生成动作和视频的通用世界模型

Pandora是通向通用世界模型(GWM)的重要一步,通过自然语言动作和视频状态的模拟生成,实现了对未来的自主控制,为交互式内容生成、强大的推理和规划能力提供了支持。

image.png

【AiBase提要:】

🔍 Pandora实现了对未来的自主控制,用户可以通过自由文本输入动作来实时控制视频内容。

🔍 Pandora能够生成多个替代未来的视频,让用户能够自主控制未来的发展方向。

🔍 Pandora在不同领域中实现迁移学习,通过高质量数据指导和训练,模型学习有效的动作控制。

详情链接:https://top.aibase.com/tool/pandora

7、AI视频编辑方法ReVideo:可局部修改视频内容和运动轨迹

本文介绍了一种名为ReVideo的AI视频编辑方法,通过指定内容和运动实现精确的视频编辑。该方法采用三阶段训练策略和时空自适应融合模块,具有出色的编辑效果。研究人员解决了内容和运动控制之间的耦合和训练不平衡问题,提出了逐步解耦的训练策略。实验证明ReVideo在准确的视频编辑应用方面性能优秀,推动了视频编辑领域的发展。

image.png

【AiBase提要:】

🔍 新颖方法实现精确视频编辑,同时指定内容和运动

🔍 三阶段训练策略和时空自适应融合模块集成内容和运动控制

🔍 逐步解耦训练策略解决内容和运动控制耦合和训练不平衡问题

详情链接:https://top.aibase.com/tool/revideo

8、每周节省7800万工时!ChatGPT等成美国降本增效利器

本文介绍了Pearson plc发布的关于生成式AI如何帮助人们提升工作效率节省时间的深度研究报告。报告分析了美国、英国、澳大利亚、巴西和印度5个国家,在2026年前,美国将节省最多时间,达每周7800万工时。生成式AI在10个领域具有显著节省时间的应用,包括维护健康记录、专业知识学习、教育课程制定等。文章还提供了使用案例和企业员工应对生成式AI的建议。

【AiBase提要:】

🔍 生成式AI可帮助节省大量工时,美国每周可节省7800万工时,印度排名第二。

💡 10个领域中,维护健康记录、专业知识学习、教育课程制定等可节省大量工时。

🚀 企业应将生成式AI视为提升员工、企业价值的常规工具,制定明确的使用规则和指南。

9、Nvidia首席执行官Jensen Huang强调GenAI初创公司激增

Nvidia首席执行官Jensen Huang在财报电话会议中指出,有20,000家GenAI初创公司正在其加速计算平台上开发,需求激增导致供应短缺,预计持续至2024年。公司积极推进以太网网络拓展人工智能计算领域,取得数据中心和游戏领域突破性增长。

【AiBase提要:】

⭐ 20,000家GenAI初创公司在Nvidia加速计算平台上开发,需求激增导致供应短缺,预计持续至2024年。

⭐ Nvidia积极推进以太网网络,拓展人工智能计算领域,以太网是进军数据中心网络的重要机遇。

⭐ 数据中心业务是Nvidia增长的主要驱动力,第一季度营收达260亿美元,同比增长262%,游戏领域营收也有18%增长。

10、研究发现 52% 的 ChatGPT 编程问题回答错误

这篇文章揭示了人工智能 ChatGPT 在生成编程问题答案中存在的严重问题,其中有52% 的答案是错误的。尽管 ChatGPT 的回答在语言上更正式和分析性更强,但却存在信息不准确、冗长和与人类答案不一致的情况。然而,令人担忧的是,许多人类程序员更偏好使用 ChatGPT 的答案,这可能是因为其礼貌和愉快的语气给人留下更好的印象。

【AiBase提要:】

🚫 52% 的 ChatGPT 编程问题回答错误

🔍 ChatGPT 的回答语言更正式和分析性更强,但存在信息不准确、冗长和与人类答案不一致的问题

👩‍💻 许多人类程序员更偏好使用 ChatGPT 的答案

11、FCC对电话骗子罚款600万美元,利用声音克隆技术冒充拜登总统进行非法电话骚扰

文章报道了美国FCC对一名电话骗子罚款600万美元的事件,该骗子利用声音克隆技术冒充总统拜登进行非法电话骚扰,引发了关于电话骚扰与人工智能关系的讨论。FCC强调警告其他潜在高科技诈骗者遵守电话骚扰法规,尤其是使用生成式人工智能技术。

【AiBase提要:】

⭐ FCC对电话骗子罚款600万美元,利用声音克隆技术冒充拜登总统进行非法电话骚扰

⭐ FCC强调警告其他潜在高科技诈骗者,要求遵守电话骚扰法规,尤其是使用生成式人工智能技术

⭐ 骗子利用声音克隆技术在新罕布什尔州初选期间冒充总统拜登进行电话骚扰,涉案者应对多项违规行为接受指控

举报

  • 相关推荐
  • AI日报:月之暗面首款自主智能体Kimi-Researcher;MiniMax推音色设计功能;Jaaz发布Lovart AI本地化替代品

    【AI日报】今日AI领域重要动态:1)月之暗面发布Kimi-Researcher智能体,多轮搜索推理能力超越谷歌和OpenAI同类产品;2)MiniMax推出Voice Design功能,支持多语言/音色组合;3)火山引擎上线AI智能域名推荐功能;4)Anthropic强化VSCode集成;5)Google推出Gemini2.5Flash-Lite模型,可实时生成交互界面;6)苹果拟300亿美元收购AI公司Perplexity;7)月之暗面开源Kimi-2506多模态模型;8)Firecrawl将推出开源问答引擎Fireplexity;9)银河通用机器人获宁德时代10亿元融资;10)字节跳动发布DreamActor-H1视频生成系统;11)Google推出开源实时音乐生成模型Magenta RealTime;12)开源AI设计工具Jaaz发布。

  • AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

    本期AI日报聚焦多项AI领域重要进展:1) Midjourney推出首款视频生成模型V1,支持21秒视频生成;2) OpenAI CEO确认GPT-5将于今夏发布;3) Google上线语音对话搜索功能Search Live;4) OpenAI开源客户服务代理框架;5) MiniMax发布智能代理Agent;6) 恶意工具WormGPT出现新变种;7) OpenAI推出企业版ChatGPT折扣;8) DeepSite V2支持3D网页动画生成;9) AI工具可秒变PPT;10) 比亚迪与字节跳动合作开发动力电池技术;11) 马斯克否认xAI巨额亏损传闻。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • Soul App全双工语音大模型升级,让AI在交互中拥有“主动性”

    社交平台Soul App近日升级端到端全双工语音通话大模型,重新定义"全双工"交互模式。新模型突破传统语音交互依赖VAD机制与延迟控制逻辑的局限,赋予AI自主决策对话节奏的能力,实现主动打破沉默、适时打断用户、边听边说、时间语义感知等类人交互体验。同时具备多维度感知、口语化表达、音色复刻等功能,让AI更具"真人感"。该技术将应用于虚拟人实时通话、AI匹配1V1互动等场景,并探索多人互动场景应用。Soul CTO陶明表示,社交是情绪价值和信息价值的双向关系,平台将持续通过技术创新为用户提供更智能、沉浸的社交体验。数据显示,71.1%年轻人愿意和AI做朋友建立情感连接,AI社交正成为重要趋势。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 如何用 Kimi AI 创作儿童歌词?

    本文介绍如何利用Kimi AI创作儿童歌词。用户只需在Kimi平台注册登录后,明确创作主题(如"小兔子"等),输入包含歌词风格、内容要求的提示词,AI即可快速生成富有童趣的歌词初稿。用户可对生成内容进行调整优化,如简化副歌、修改韵律等,使歌词更符合儿童理解和演唱需求。该工具适用于亲子互动、儿童教育等场景,能帮助家长轻松创作专属儿歌。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 月之暗面放王炸!开源Kimi新模型:超新版DeepSeek R1全球第一

    月之暗面推出了针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。 该模型在SWE-bench Verified编程基准测试中取得了全球最高开源模型水平,以仅72B的参数量,超越了刚发布不就、参数量达671B的新版DeepSeek-R1。

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。