首页 > 业界 > 关键词  > Allegro最新资讯  > 正文

AI日报:Rhymes AI开源视频生成模型Allegro;Grok API正式上线;ComfyUI发布桌面一键安装包ComfyUI V1

2024-10-22 15:44 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Rhymes AI开源视频生成模型Allegro:文本秒变高清视频

Rhymes AI最近开源了先进的文本生成视频模型Allegro,为人工智能生成视频领域带来新的可能性。Allegro能将简单文字描述转换为高质量短视频,支持各种电影主题,包括人物特写和动作场景。该模型核心技术包括大规模视频数据处理、视频压缩为视觉token和扩展视频扩散Transformer。团队正积极开发更先进功能,如图像到视频生成、运动控制和更长、基于叙事的视频支持。

【AiBase提要:】

🔑 Allegro能根据文字提示生成高质量短视频,覆盖各种电影主题。

🔑 核心技术包括大规模视频数据处理、视频压缩为视觉token和扩展视频扩散Transformer。

🔑 Rhymes AI开源Allegro模型权重和代码,鼓励社区探索、释放创造力,取得协作性进展。

详情链接:https://github.com/rhymes-ai/Allegro

2、Adobe新AI神器Project Turntable发布!2D矢量图秒变3D效果

Adobe在MAX2024大会上发布的全新AI工具Project Turntable让设计界为之振奋。这款革命性工具利用独特的AI算法,实现了2D矢量图像类似3D物体的自由旋转,彻底颠覆了传统的图像编辑方式。设计师只需简单操作,即可实现360度旋转,AI智能补全视角盲区,呈现令人惊叹的3D视觉效果。

【AiBase提要:】

✨ 革命性AI工具:Project Turntable让2D图像实现类似3D物体的自由旋转,改变传统设计方式。

🎨 智能补全功能:AI能自动补全旋转过程中的视角盲区,展现出令人惊叹的3D效果。

🚀 先进生成式AI算法:通过深度学习和分析,AI能准确预测并生成图像缺失部分,确保作品完整性和连贯性。

3、马斯克官宣!xAI的Grok API正式上线,仅支持grok-beta模型、功能尚待完善

马斯克的AI新创公司xAI推出了名为Grok的生成性AI模型API,虽然功能还相对简单,但已正式实现。用户反馈购买使用积分时遇问题,API功能尚未全面上线。马斯克计划利用X平台数据训练AI模型,提升公司技术水平,尽管面临股东质疑。

image.png

【AiBase提要:】

🚀 xAI的API正式推出,仅支持“grok-beta”模型。

💰 用户反馈购买使用积分时遇问题,API尚未全面功能上线。

🧠 马斯克计划利用X平台数据训练AI模型,提升各大公司技术水平,尽管面临股东质疑。

4、ComfyUI发布桌面一键安装包ComfyUI V1支持自动更新

ComfyUI近日发布V1版本更新,带来一系列重大改进,包括全新桌面版应用、用户界面革新以及自定义节点安全机制升级。新版桌面应用支持跨平台运行,自动更新功能确保用户始终使用最新稳定版本。用户界面设计革新,模型库和工作流程浏览器功能优化。同时推出自定义节点注册表(CNR),提供更安全、稳定的自定义节点体验。

【AiBase提要:】

🚀 新版桌面应用支持跨平台运行,自动更新功能确保用户始终使用最新稳定版本。

💻 用户界面设计革新,顶部菜单栏整合功能,模型库和工作流程浏览器功能优化。

🔒 推出自定义节点注册表(CNR),提供更安全、稳定的自定义节点体验。

详情链接:https://www.comfy.org/waitlist

5、高通推出骁龙8至尊版处理器:端侧AI与智谱、腾讯混元达成合作

在今日举办的骁龙峰会2024上,高通技术公司发布了备受期待的骁龙8至尊版移动平台,采用台积电第二代3nm制程工艺,刷新手机处理器性能记录。新设计包括全大核架构,主频高达4.32GHz的超大核和3.53GHz的大核,提升45%性能,降低44%功耗。GPU性能提升40%,功耗降低40%,支持光线追踪。多款旗舰手机将搭载此芯片,带来前所未有的性能体验。与智谱、腾讯混元达成合作,推动端侧AI应用和普及。

image.png

【AiBase提要:】

🚀 骁龙8至尊版采用全新全大核设计,刷新手机处理器性能记录。

💡 骁龙8至尊版GPU性能提升40%,功耗降低40%,支持光线追踪。

📱 多款旗舰手机将搭载骁龙8至尊版芯片,带来前所未有的性能体验。

6、Meta智能眼镜在欧洲畅销,AI 功能未上线销量却超越传统Ray-Ban

Meta与Ray-Ban合作推出的智能眼镜在欧洲市场取得了巨大成功,尽管缺乏AI功能,但销量超越了传统Ray-Ban产品。消费者对眼镜内置的扬声器和摄像头表现出浓厚兴趣,展现了产品的吸引力。合作伙伴EssilorLuxottica的首席财务官透露,Ray-Ban Meta在60%的门店中成为畅销产品,为公司销售做出重要贡献。

image.png

【AiBase提要:】

📈 Ray-Ban Meta智能眼镜在60%的Ray-Ban门店中成为销量冠军。

🛠️ 尽管缺乏AI功能,但扬声器和摄像头依然受到消费者青睐。

🤝 Meta决定与EssilorLuxottica延长合作关系,期待未来更多功能推出。

7、首件人形机器人创作艺术品即将在苏富比拍卖

近期苏富比拍卖行将展出人形机器人艺术家Ai-Da的作品,引发了人们对人工智能与艺术结合的新讨论。这次拍卖将开启新的艺术创作趋势,激发了对当代艺术的思考,展示了科技与艺术的融合之美。

image.png

【AiBase提要:】

🎨 苏富比将在10月31日首次拍卖人形机器人Ai-Da的艺术作品,估价在12万至18万美元之间。

🤖 Ai-Da通过摄像头、AI算法和机器人手臂创作,成为第一位人形机器人艺术家。

💰 拍卖收益将用于支持Ai-Da项目,推动机器人艺术创作的持续发展。

8、华尔街日报和纽约邮报联合起诉 Perplexity AI 大量盗用内容

这篇文章报道了华尔街日报和纽约邮报联合起诉人工智能公司Perplexity AI涉嫌大规模盗用版权内容的事件。涉及到知识产权侵权和AI生成内容的合法性问题,引发了业界的关注和讨论。

【AiBase提要:】

📄 新闻集团联合起诉Perplexity AI,指控其大量盗用版权内容。

⚖️ 诉讼要求Perplexity停止使用新闻文章,并销毁相关数据库。

🤖 Perplexity AI自称为AI问答引擎,但此前已因内容侵权遭到多次指控。

9、库克:苹果在AI领域不急于抢先,但注重产品完善度

苹果CEO蒂姆·库克表示,虽然苹果在AI领域并非第一,但公司更注重为用户带来最佳体验,而不是争夺市场的先行者地位。库克强调产品完善度的重要性,认为推出真正卓越的产品比抢先上市更重要。他分享了个人使用AI带来的工作效率提升,预计Apple Intelligence将在未来为用户带来深远影响。

【AiBase提要:】

🍎 苹果注重用户体验,不追求市场先行

🔝 产品完善度比市场抢先更重要

🚀 Apple Intelligence将深刻影响用户体验

10、垂类大模型再现并购:OPPO收购波形智能

本文报道了OPPO收购杭州波形智能科技有限公司的消息,创始人姜昱辰将入职OPPO。波形智能产品仍在正常运营,但在发布Weaver2.0版本不到三个月后即被收购。这次收购反映了垂类大模型公司面临的发展困境,也印证了大厂对AI人才的渴求趋势。

【AiBase提要:】

🔍 OPPO收购波形智能,创始人姜昱辰将加入OPPO。

💼 波形智能产品仍在正常运营,但在发布新版本后不久即被收购。

💡 垂类大模型公司面临发展困境,大厂对AI人才的渴求趋势愈发明显。

举报

  • 相关推荐
  • AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

    本期AI日报聚焦多项AI领域重要进展:1) Midjourney推出首款视频生成模型V1,支持21秒视频生成;2) OpenAI CEO确认GPT-5将于今夏发布;3) Google上线语音对话搜索功能Search Live;4) OpenAI开源客户服务代理框架;5) MiniMax发布智能代理Agent;6) 恶意工具WormGPT出现新变种;7) OpenAI推出企业版ChatGPT折扣;8) DeepSite V2支持3D网页动画生成;9) AI工具可秒变PPT;10) 比亚迪与字节跳动合作开发动力电池技术;11) 马斯克否认xAI巨额亏损传闻。

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • AI日报:美团No Code平台免费开放;豆包App升级“一句话P图”功能;苹果Xcode 26内置ChatGPT等AI功能

    本文介绍了AI领域多项重要进展:1)美团推出No Code平台和1680个AI应用;2)豆包App升级"一句话P图"功能;3)苹果发布内置ChatGPT的Xcode26开发工具;4)iOS26新增视觉智能功能;5)讯飞星火X1升级版即将发布;6)比亚迪接入阿里通义大模型;7)DeepSeek支持本地工具调用;8)开源框架Rowboat支持快速构建智能助手;9)X平台整合Grok AI优化内容推荐;10)港科大开发进化搜索技术提升小模型图像生成能力;11)硅基流动完成数亿元融资;12)港大与英伟达合作开发新型视觉注意力机制。这些创新展示了AI技术在各领域的快速发展和应用突破。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • AI日报:DeepSeek开源新版R1-0528;字节发布图像Agent小云雀AI;可灵2.1重磅上线

    本期AI日报聚焦多项AI领域突破:1)DeepSeek发布R1-0528模型,支持128K上下文且性能媲美GPT-4;2)字节推出"小云雀AI"图像创作工具;3)可画2.1版本价格降65%性能提升;4)Opera发布全球首款AI浏览器Neon;5)Meta推出多模态空间理解模型;6)北大团队研发ZeroSearch框架降低大模型训练成本88%;7)字节推出AI视频剪辑应用"剪小映";8)MotionPro实现40ms/帧精准视频控制;9)xAI与Telegram达成3亿美元合作部署Grok聊天机器人;10)OpenAI重组架构为IPO铺路;11)像素蛋糕"方糖大模型"获国内首个影像行业备案;12)Paper2Poster实现论文自动转海报;13)Resemble AI开源TTS模型性能比肩ElevenLabs;14)蚂蚁集团开源对标GPT-4o的多模态模型Ming-lite-omni。

  • AI日报:ChatGPT支持MCP和会议记录功能;Cursor 1.0 版本重磅发布;Midjourney视频功能将在本月上线

    本期AI日报聚焦多项AI领域突破:1)OpenAI为ChatGPT新增企业数据连接和会议记录功能;2)Cursor 1.0发布集成BugBot等开发工具;3)Midjourney即将推出视频生成功能;4)秘塔AI搜索新增PPT导出功能;5)Manus推出文本生成视频工具挑战Sora;6)法国Mistral发布企业级编程助手;7)英伟达推出文档处理专用AI模型;8)腾讯公益引入大模型提升互动体验;9)Firecrawl推出网页抓取API工具;10)Bland AI实现超真实语音克隆;11)报告显示AI训练成本逼近百亿美元;12)开源设计工具Jaaz支持批量图像生成;13)《逆水寒》手游接入AI实现图片动效玩法。