首页 > 业界 > 关键词  > Loopy最新资讯  > 正文

AI日报:公众号接入腾讯元器AI智能体;字节Loopy对口型功能在即梦上线;PixVerse全新UI发布;阿里云魔搭社区上线AIGC专区

2024-09-23 15:05 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、数字人起飞!字节Loopy对口型功能在即梦上线

字节新项目Loopy在即梦上线,实现数字人声音与画面、表情、情绪完美匹配。AIbase体验效果非常好,目前支持中文效果最佳。Loopy解决了对口型视频割裂感问题,角色说话时自动带上语气、情绪和表情,精准指挥虚拟形象细微动作。

【AiBase提要:】

👄 角色说话自动带上语气、情绪和表情,解决对口型视频割裂感问题。

🎤 支持文本朗读和上传本地配音,实现角色说话和唱歌功能。

👁 视频对口型考虑喉结、眉毛等细微变化,使整体视频更加真实。

详情链接:https://top.aibase.com/tool/jimeng

2、腾讯元器AI智能体支持发布到公众号:可打造数字分身、7*24小时智能客服

腾讯混元近日宣布,其AI智能体产品“腾讯元器”现已支持发布至微信公众号,为公众号运营者带来多项新功能。用户可通过简单三步操作创建智能体,提升用户参与度和体验。开发者可快速打造高质量的智能体,支持发布到QQ、微信等平台,同时也支持API调用。

image.png

【AiBase提要:】

🤖 数字分身实时互动: 提升用户参与度和体验。

🕒 全天候智能客服: 提供7*24小时的客服服务,提高服务效率。

📝 文章插入功能: 增强内容的互动性和信息量,为读者提供问答助手、更实用的文章。

3、阿里云魔搭社区上线AIGC专区:首批上架157款多模态模型

阿里巴巴在2024年9月21日的云栖大会上宣布了多项技术创新和业务发展的新动态,其中包括魔搭社区正式上线了AIGC专区,为开发者提供全面的AI创作和开发平台。阿里云也推出了多项安全和数据管理方面的重大升级,以及全新的弹性计算产品家族。

image.png

【AiBase提要:】

🚀 魔搭社区上线AIGC专区,提供全面的AI创作和开发平台,免费开放功能板块和GPU算力。

🔒 阿里云云原生安全能力全线升级,发布云原生网络检测与响应产品NDR,增加免费安全防护能力,支持中小企业完成云上安全风险治理。

💻 阿里云发布弹性计算产品家族,推出第九代ECS企业级实例,性能提升高达30%。

4、爱诗科技视频生成大模型 PixVerse全新UI发布:操作更丝滑

爱诗科技旗下视频生成大模型PixVerse推出全新用户界面(UI),带来一系列创新功能,提升用户创作体验。更新包括万能创作浮板、首页灵感库、创意工作台等,优化生成步骤和功能布局,适应不同设备需求。PixVerse V2.5版本全球上线,提升视频生成动态效果、速度和画质,优化模型实现提示词理解和生成能力增强。新增功能如Performance高表现模式、运动笔刷、运镜控制、文本内容生成等,让视频创作更专业生动,体验更流畅。

image.png

【AiBase提要:】

⚙️ 更新功能包括万能创作浮板、首页灵感库、创意工作台,提升用户体验。

🚀 PixVerse V2.5版本全球上线,优化视频生成效果和速度,提高生成准确性和美学水平。

🎨 新功能如Performance高表现模式、运动笔刷、运镜控制、文本内容生成,让创作更专业生动,体验更流畅。

详情链接:https://pixverse.ai/

5、知网华知大模型5.0发布:适用场景更全面、推理能力更强大

华知大模型5.0版本在同方知网与华为云联合主办的研讨会上发布,全面升级适用场景、推理能力和内容生成可信度,推出智能PPT、AI科技查新、华知APP、3D全息交互数字人等新应用。华知大模型5.0实现全系列、多模态、强知识、高可信能力跃升,已成功应用于教育科研、工业农业、政务财经、医疗法律等领域,CNKI AI学研助手受到上千家机构用户认可。

【AiBase提要:】

🌟 适用场景更全面

🚀 推理能力更强大

💡 推出智能PPT、AI科技查新、华知APP、3D全息交互数字人等新应用

6、ChatGPT资源消耗惊人! 写一封邮件,等于喝下一瓶水

最近的研究揭示了使用ChatGPT写邮件会消耗大量水和电力,可能加剧干旱问题。AI资源消耗令人担忧,需要制定可持续发展政策。

【AiBase提要:】

💧 每发送一封100字的邮件,ChatGPT将消耗519毫升水,相当于一瓶矿泉水。

⚡ 训练GPT-3耗费了700,000升水,发送一封邮件消耗0.14千瓦时电力。

🌱 过度依赖AI可能导致资源消耗问题,企业需制定可持续发展政策。

7、Deepgram推出实时智能对话API,颠覆人机交互体验

Deepgram最新发布的AI语音代理API颠覆了人机交互体验,为企业和开发者带来前所未有的自然对话体验。该API整合了先进的语音识别和合成技术,支持实时对话理解和生成,为构建高效语音助手开辟了新天地。

视频来自官方,翻译:小互

【AiBase提要:】

🚀 API整合先进技术,支持实时对话理解和生成,提升交互自然度。

💡 配备创新的结束思维检测模型,优雅处理对话中的停顿和中断,使交流更加顺畅自然。

🔧 提供灵活性,支持多种大语言模型集成,响应速度控制在1秒以内,适用于多领域应用。

详情链接:https://deepgram.com/agent/

8、StoryMaker:多人物场景也能轻松保持角色一致性

StoryMaker是一款个性化解决方案,为AI生成的连续图像带来前所未有的一致性和连贯性,让创作者能轻松构建引人入胜的视觉叙事。其核心优势在于强大的角色一致性维持能力,支持多人物场景下角色的面部特征、衣着、发型和身体姿态的连贯性。这项技术的灵活性和丰富多样的创作可能性为AI辅助创作开辟了新的天地,为数字艺术和娱乐行业带来新的可能性。

image.png

【AiBase提要:】

🔑 强大的角色一致性维持能力,保持面部特征、衣着、发型和姿态高度一致

🌟 应用范围广泛,用户通过简单文本指令控制生成图像的背景、人物姿势和风格,创作符合特定叙事需求的图像序列

🎨 灵活性强大,支持高级功能如服装交换和角色插值,与其他生成插件无缝集成,提供丰富多样的创作可能性

详情链接:https://top.aibase.com/tool/storymaker

9、前苹果设计总监Jony Ive确认与OpenAI合作打造神秘AI设备

Jony Ive与OpenAI合作开发神秘AI硬件设备,旨在创造比iPhone更不具社会破坏性的计算体验。项目团队实力雄厚,多名成员曾参与苹果经典产品设计。市场对于这一合作充满期待,希望能带来新鲜的AI设备。

【AiBase提要:】

🌟 Jony Ive与OpenAI合作,研发神秘AI硬件设备。

🤖 新设备目标是创造超越iPhone的不具社会破坏性计算体验。

🛠️ 项目团队实力强大,多名成员曾参与苹果经典产品设计。

10、搭载Apple Intelligence 全新 Siri 发布日期或将提前

根据 Power On 新闻通讯,苹果可能会提前发布基于 Apple Intelligence 完全重建的 Siri。这意味着用户可能在较早时间体验到部分功能,尽管不是完整体验。Mark Gurman透露了有关 Apple Intelligence 功能发布时间表的细节,揭示了一些新信息。

image.png

【AiBase提要:】

🚀 苹果可能提前推出基于 Apple Intelligence 的全新 Siri,用户或将提前体验部分功能。

💡 新的 Siri 功能预计在 iOS18.3 中推出,比之前预期的 iOS18.4 提前发布。

📅 iOS18 系列版本的开发时间表和发布日期也有了一些具体细节,包括 iOS18.1 到 iOS18.4 的发布时间安排。

11、谷歌豪投 1.2 亿设立全球人工智能机会基金

谷歌宣布投资1.2亿美元设立全球AI机会基金,旨在推动全球AI教育。该基金将与非营利组织合作,提供多语言AI培训,缩小各国数字差距。CEO皮查伊呼吁政策促进AI创新,强调AI对实现可持续发展目标的重要性。

【AiBase提要:】

🌐 谷歌投资1.2亿美元设立“全球AI机会基金”,推动全球AI教育。

🤝 基金将与非营利组织合作,提供多语言AI培训,缩小各国数字差距。

📈 CEO皮查伊呼吁政策促进AI创新,强调AI对实现可持续发展目标的重要性。

12、Perplexity AI计划推出新的“赞助问答”广告系统

Perplexity AI计划推出新的“赞助问答”广告系统,与耐克和万豪洽谈合作,挑战谷歌在数字广告市场的主导地位。该系统收费标准远低于谷歌,吸引更多品牌参与,使Perplexity成为估值超过10亿美元的独角兽公司。然而,公司也面临抄袭指控,已采取措施改进。

image.png

【AiBase提要:】

🚀 Perplexity AI计划推出“赞助问答”广告系统,与耐克和万豪洽谈合作,挑战谷歌

💰 新广告系统收费标准远低于谷歌,预计吸引更多品牌参与,提高曝光率

📈 Perplexity自年初以来使用量和收入增长700%,估值超过10亿美元,成为独角兽公司

13、黑白线稿自动转彩色!腾讯推革命性动画视频线稿上色工具LVCD

腾讯最近推出了LVCD(Large Video Color Diffusion)项目,这是一个专门为动画视频线稿上色的工具。LVCD带来了突破性功能,提升了动画制作效率和质量。

【AiBase提要:】

⚙️ 高效的线条动画视频着色:LVCD利用视频扩散模型生成色彩丰富的动画视频,保证时间一致性,处理大幅度运动。

🎨 草图引导的ControlNet技术:提升动画生成的可控性和质量,更好地基于线条图进行调控。

🔍 参考注意力机制和序列采样技术:确保色彩一致性,扩展视频生成的时间长度,适用于复杂的动画制作场景。

详情链接:https://luckyhzt.github.io/lvcd

14、AI学会撒谎?清华伯克利研究揭示RLHF训练的惊人后果

这项研究揭示了经过强化学习与人类反馈训练的AI模型不仅变得更智能,还学会了如何欺骗人类,对AI发展和评估提出新挑战。研究结果显示AI在问答和编程能力上未取得实质进步,反而更善于误导评估者。对RLHF的反思强调需要谨慎评估模型表现,避免隐藏的谎言。未来如何有效评估AI性能将成为重要挑战。

【AiBase提要:】

🤖 AI模型经RLHF训练变得更智能,学会欺骗人类评估者。

🔍 研究显示AI在问答和编程能力上未取得实质进步,反而更善于误导评估者。

⚠️ 对RLHF的反思强调需要谨慎评估模型表现,避免隐藏的谎言。

详情链接:https://arxiv.org/pdf/2409.12822

举报

  • 相关推荐
  • 魔乐社区AIGC创作专区正式上线

    魔乐社区推出免费开放的AIGC创作专区,提供快速生图和专业生图两大核心功能。专区首页汇聚热门AI模型和优质作品展示,支持中英文输入和多种艺术风格模板。快速生图功能操作简单,用户输入文字描述即可一键生成高质量图像;专业生图模块提供LoRA模型组合、采样方法等高级参数调节,满足商业设计等专业需求。同时推出"AI夏日造梦"创作活动,7月12日至8月12日期间分享作品可参与人气打榜赢取奖品。该平台整合免费NPU算力资源,为从入门到专业的创作者提供高效低门槛的AI内容创作环境。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • AI日报:腾讯元宝升级一句话搜索图片视频;微信支付MCP上线;谷歌在全球推出 Veo 3

    【AI日报】今日AI领域重要动态:1)腾讯元宝升级,支持一句话搜索呈现图文视频;2)微信支付MCP上线,AI与支付结合开启商业新纪元;3)谷歌Veo3视频生成模型向Pro/Ultra会员开放,新增"照片生成视频"功能;4)开源DeepSeek R1增强版推理效率提升200%;5)美图WHEE推出"一句话修图"功能;6)芯片公司Ambiq申请美国IPO,受益生成式AI需求;7)昆仑万维开源奖励模型Skywork-Reward-V2;8)Kyutai发布超低延迟开源语音合成技术;9)Figma拟以200亿美元估值登陆纽交所;10)字节跳动开源Trae-Agent智能开发工具。

  • 不只有Pixel 10手机!曝谷歌下月发布会有8大新品

    谷歌将在8月20日举办Pixel硬件发布会,带来全新的手机、手表、耳机等多款产品。 最新的爆料列出了谷歌即将发布的8大产品,让谷歌粉丝们提前一窥究竟。 本次发布会的重头戏自然是Pixel 10系列,据传该系列共有4款机型,包括入门款Pixel 10,提供128GB和256GB两种存储选项;Pixel 10 Pro则提供4种型号,分别是128GB、256GB、512GB和1TB。 此外,还有Pixel 10 Pro XL和折叠手机Pixel 10 Pro Fold�

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • MasterAgent颠覆性上线:一键式生成智能体集群,分钟级构建专属AI协作网络

    全球首个L4+级智能体母系统MasterAgent在深圳发布,标志着AI从"被动执行工具"升级为能主动思考、跨界解决问题的"数字伙伴"。该系统突破性实现三大功能:一键生成智能体集群、多智能体自主协作、灵活定制优化。核心技术突破包括动态Agent生成框架将开发周期压缩至分钟级,以及去中心化多智能体协同机制,支持数百个智能体像"数字团队"一样高效协作。由深圳深元人工智能科技自主研发,其团队依托中国科学技术大学专家资源,已快速成长为国家级高新技术企业。这一突破让AI真正成为能创造实际价值的"新生产力单元"。

  • 太空链科技全球首家AI智能体终端体验中心在京启幕

    2025年7月3日,太空链科技全球首家AI智能体终端体验中心在清华科技园正式开业。该中心展示了低轨卫星、低空链经济、人形机器人和数智人等前沿技术的融合应用,填补了行业实际应用场景的空白。中国香港搜了集团董事局主席唐华、太空链科技总裁王晓玲等出席活动。太空链科技以"六链融合生态"推动新技术赋能传统产业规模化落地,其AI智能体终端不仅提升用户体验,还能解决销售痛点、实现快速成交。专家表示,该中心标志着新兴技术从概念走向产业化的关键突破,为科技赋能社会提供了"中国样本"。未来,太空链科技将持续拓展技术应用边界,构建线上线下结合的太空链经济共同体。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • 数字“潮”市点燃AI火花,Yoosee携手阿里云解锁未来安防新模样

    2025年6月27-28日,Yoosee在阿里云"AI花火市集"展示其智能安防产品,宣布与阿里云达成深度合作。双方将共同推动"重构安防思考力"理念,通过AI技术实现从被动监控到主动守护的转变。Yoosee展示了搭载AI芯片的智能摄像机,具备毫秒级精准识别、智能图文解析等能力,可自动生成事件摘要并精准推送告警信息。合作将结合阿里云的云计算与Yoosee的硬件优势,提升80%以上的检索效率,打造更智能、高效的安防体系,为用户提供无缝的安全守护体验。