首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:快手推“可灵AI”独立APP;百度将推AI智能眼镜;智谱AI开源CogVideoX v1.5并上线“新清影”;Krea AI上线Lora训练功能

2024-11-08 15:43 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、快手推出“可灵AI”独立APP 加码移动端AI创作布局

快手最近推出了“可灵AI”独立APP,致力于在移动端扩展AI创作领域。该APP基于快手自研的可灵大模型和可图大模型,提供视频、图片生成与编辑能力。尽管功能上不及网页版,但已吸引360万用户,创作超过3700万个视频和一亿张图片。与抖音的“即梦AI”APP形成竞争。

image.png

【AiBase提要:】

🚀 快手推出“可灵AI”独立APP,扩展移动端AI创作布局。

💡 “可灵AI”APP基于自研大模型,提供视频、图片生成与编辑能力。

💪 已吸引360万用户,创作超过3700万视频和一亿张图片。与抖音的“即梦AI”形成竞争。

2、智谱AI开源最新版视频模型CogVideoX v1.5

智谱技术团队发布了最新视频生成模型CogVideoX v1.5,并将其开源。这一版本在视频生成能力方面有重大提升,支持5/10秒视频、768P分辨率和16帧生成能力。新清影平台上线,结合CogSound音效模型,提供超高清4K视频生成。数据处理与算法创新确保视频质量和连贯性。

image.png

【AiBase提要:】

🚀 CogVideoX v1.5开源,支持5/10秒视频、768P分辨率和16帧生成能力。

🎬 新清影平台上线,结合CogSound音效模型,提供超高清4K视频生成。

🔬 数据处理与算法创新,确保生成视频的质量和连贯性。

详情链接:https://github.com/thudm/cogvideo

3、报道称百度将发布一款内置 AI 助手的智能眼镜,基于文心模型

百度计划推出一款内置小度 AI 助手的智能眼镜,将在2024年度百度世界大会上展示。这款眼镜具有创新功能,提供全新智能体验。

【AiBase提要:】

🌟 眼镜将配备摄像头,支持照片和视频拍摄功能。

📷 眼镜支持基于 Ernie 模型的语音交互,提升用户体验。

🗣️ 百度智能眼镜将提供更个性化、符合中国用户需求的解决方案。

4、氪金玩家狂喜!Krea AI上线Lora训练功能

Krea AI推出了Lora训练功能,为用户提供个性化角色、风格、产品等训练服务。用户上传多张图片即可开始训练,界面简洁易用。训练参数设置简单,训练效果良好,对小白用户友好。会员价格为每月10美元,支持商用。

【AiBase提要:】

🔥 Krea AI推出Lora训练功能,让用户定制个性化角色、风格、产品等训练服务。

💡 界面简洁,上传图片后即可设置基础参数,训练过程简单易上手。

💰 会员价格每月10美元,可生成720张FLux图像,36000张实时图像,支持商用。

详情链接:https://www.krea.ai/train

5、可灵推自定义模型功能 克服AI视频生成角色一致性难题

可灵最新推出的自定义模型功能为AI视频生成领域带来重要突破,解决了角色一致性的技术难题。该功能让创作者上传多个视频片段进行训练,支持使用可灵自身生成的AI视频,提供更大灵活性。训练后系统能生成保持角色一致性的视频内容,展示出色彩斑斓的创作可能。

image.png

【AiBase提要:】

🔑 创作者可上传多个视频片段进行模型训练,支持使用可灵自身生成的AI视频,提供更大灵活性。

🚀 训练完成后系统能生成保持角色一致性的视频内容,展示360度旋转展示和复杂场景的稳定外观特征。

💡 KLING1.5版本支持1080p高清视频输出,提供多种格式选择,满足不同平台的内容需求。动作笔刷工具提升视频创作精确度和灵活性。

6、小巧强大!口袋级视觉AI模型moondream2,手机就能运行

Moondream推出的moondream2是一款性能出色的紧凑型视觉语言模型,仅有16亿参数,可在智能手机等小型设备上运行。该模型具备强大的文本和图像处理能力,在各项基准测试中表现优异。Moondream团队持续更新模型性能,成功筹集450万美元资金,CEO具有丰富经验。

image.png

【AiBase提要:】

🌟 Moondream推出moondream2,仅有1.6亿参数,可在智能手机等小型设备上运行。

💰 Moondream成功筹集450万美元资金,CEO曾在亚马逊工作,团队持续更新提升模型性能。

📈 moondream2具备强大的文本和图像处理能力,能回答问题、进行OCR、物体计数和分类,基准测试表现出色。

详情链接:https://huggingface.co/vikhyatk/moondream2

7、小米官宣大模型小爱升级:多端设备支持“音乐问答”功能

小米官方宣布大模型小爱音乐能力升级,新增了「音乐问答」功能,用户可在多端设备上体验。这一功能基于人工智能能力提升,帮助用户查询歌曲信息和解答专业音乐知识。小爱同学在今年7月经历了重大版本更新,全面提升了自然问答和智能助手功能,提升用户体验。

image.png

【AiBase提要:】

🎵 小米小爱同学新增「音乐问答」功能,支持歌曲信息查询及专业音乐知识解答。

📱 功能适用于多端设备,用户需将小爱同学升级至最新版本。

🚗 小爱同学在过去的更新中,全面提升了自然问答及智能助手的多项功能,提升用户体验。

8、Mistral AI推出多语言内容审核API,挑战OpenAI

Mistral AI推出了一款全新的内容审核API,旨在与行业领军者竞争,解决AI安全与内容过滤问题。该API基于Ministral8B模型,能检测多种有害内容,支持多语言,并已在Le Chat平台上投入使用。Mistral与多家企业合作,展现其成熟技术和欧洲视角。

image.png

【AiBase提要:】

🌍 多语言支持:API覆盖11种语言,检测色情内容、仇恨言论等有害内容。

🔗 与企业合作:在Le Chat平台应用,与微软Azure、Qualcomm等建立合作关系。

🔒 技术优势:以对话背景为基础,提升对潜在有害内容的检测能力。

详情链接:https://docs.mistral.ai/capabilities/guardrailing/

9、AI “电子舌”来了!可品尝食物味道,轻松检测食品新鲜度

科学家们成功研发出一种名为“电子舌”的新型设备,利用人工智能技术,能准确区分不同咖啡混合物,检测食品和饮料新鲜度,为食品检测和品质控制提供新解决方案。电子舌模仿人类味觉技术,提高准确性和工作效率,可加速口味研发和确保产品品质。具备监测食品新鲜度功能,保护消费者健康,商家质量把控。未来应用前景广阔,可拓展至医药和环境监测等多个领域。

image.png

【AiBase提要:】

🌟 电子舌利用人工智能技术,准确区分不同咖啡混合物。

🍽️ 检测食品和饮料新鲜度,防止变质。

🔬 未来电子舌有望应用于医药和环境监测等多个领域。

详情链接:https://www.nature.com/articles/s41586-024-08003-w

10、谷歌黑科技ReCapture:可一键生成“多机位”视频大片

ReCapture技术是谷歌研究院推出的一项创新技术,通过重新生成带有自定义摄像机轨迹的视频,让用户可以从全新视角体验原始视频内容。这项技术背后的原理并不复杂,通过多视角扩散模型和遮罩视频微调技术,实现粗略视频到清晰、连贯、动感视频的转变。谷歌的研究人员表示,ReCapture不需要大量训练数据,适用于各种视频和视角转换,让普通用户也能轻松制作专业级“多机位”视频。

image.png

【AiBase提要:】

🔍 ReCapture技术让用户重新体验视频,生成带有自定义摄像机轨迹的新版本。

🛠️ 利用多视角扩散模型和遮罩视频微调技术,实现粗略视频到清晰、连贯、动感视频的转变。

🎥 ReCapture不需要大量训练数据,适用于各种视频和视角转换,让普通用户也能制作专业级“多机位”视频。

详情链接:https://generative-video-camera-controls.github.io/

11、OpenAI在版权诉讼中胜诉,AI数据抓取合法化成趋势?

近日,纽约南区法院驳回了Raw Story Media,Inc.和AlterNet Media,Inc.对OpenAI提起的版权侵犯诉讼,认为该案缺乏立案资格。这一裁决标志着在AI与版权之间的法律争议中,OpenAI赢得了一场重要的胜利,也为未来类似案件的处理提供了参考。法院裁定驳回诉讼,强调生成型AI的内容综合性使得逐字复制的可能性较小,为未来AI与版权纠纷的处理提供了法律参考和启示。

【AiBase提要:】

📜 原告未能证明因OpenAI的行为造成实际损害,法院裁定驳回诉讼。

🔍 法官强调生成型AI的内容综合性使得逐字复制的可能性较小。

⚖️ 该判决为未来AI与版权纠纷的处理提供了法律参考和启示。

12、微软Outlook推出基于AI个性化动态主题,根据天气和位置动态更新

微软最新推出的Co pilot 主题功能为Outlook带来了个性化的视觉体验,让用户能够定制独特的外观。AI驱动的主题功能不仅美观亲切,还能根据天气、地点等因素动态更新,提升用户体验。用户可以享受到更愉悦和个性化的电子邮件管理体验。

image.png

【AiBase提要:】

🌈 Co pilot 主题功能需要Co pilot Pro或企业许可证支持

🌦️ 用户可以根据天气和地点定制主题,实现动态更新

🎨 提供多种非AI主题选项,包括绿色、红色和紫色,适用于各个版本的Outlook

举报

  • 相关推荐
  • 逗哥配音:一站式AI创作平台赋能短视频生态,千万博主验证的配音软件再升级

    在短视频内容生态从粗放式铺量转向精细化质感运营的当下,配音已成为决定完播率与情绪价值的关键引擎。逗哥配音作为行业头部智能创作平台,凭借海量音色库、真人授权与全链路效率工具,以“一站式AI配音创作平台”的定位,深度赋能影视解说、小说推文、AI漫画及内容出海等多元变现赛道。其核心竞争力在于拒绝“一刀切”的配音方案,针对高潜力创作类型提供模块化赋能,并通过声音广场智能检索系统、精准节奏卡点算法及一站式效率工具箱,极大提升创作效率与沉浸留存。平台更构建了完善的声音资产增值与保护体系,推出声音授权变现模式,并建立专业的版权监控与法律维权绿色通道,吸引顶级声优与头部KOL入驻生态。未来,逗哥配音将继续以技术驱动创作普惠,为全球创作者提供更具情感温度与商业价值的声音基础设施。

  • “硅碳”携手赋能新质生产力——拥抱人工智能体开启企业智能化改造新征程

    迈入2026年,AI(人工智能)的发展已逐步在全球掀起热潮。当下,以“硅基员工”(代指人工智能体)为核心的人工智能体正在企业中加速部署,AI驱动的技术革命浪潮正以磅礴之势向我们奔涌而来。AI领域实践者们,每日都在焦虑与振奋中前行。 焦虑源于AI技术的极速迭代,若不奔跑,连留在原地都是一种奢望;振奋则因躬逢其盛,以自研AI模型推动效率革命,以打造专攻术业的�

  • 3天生成,全网获赞180万,抖音如何托举AI创作者的“电影梦”?

    ​“AI就该拍这样的片子”,“这才是AI的意义”。 这些评论,来自一部名为《纸手机》的清明节AI短片。 视频中,一个小男孩攥着皱巴巴的15块钱,站在纸扎店柜台前,想买一部能打视频电话的手机。店里的手机动辄六七十块钱,老板看着男孩手里仅有的15元,只好撕下一个纸板,卖给小男孩一部自己“手搓”的纸手机。

  • 设计行业迎来代际变革?Canva AI 2.0正全面重构创作流程

    2026年4月16日,Canva正式发布AI 2.0,对工作流程进行全链路AI重构。此次更新引入全新架构层,带来五大核心创作能力:对话式设计支持全程自然语言或语音交互迭代;智能体编排实现“一句话产出”完整作品;基于对象的智能编辑支持精准微调特定元素;持久记忆能力持续学习用户创作习惯与品牌风格;打通Slack、Zoom等第三方工具,新增自动规划、品牌智能、可交互网页生成等功能,构建覆盖日常工作全场景的AI原生工作流。Canva AI 2.0基于自研模型,运行速度最高可达同类方案的7倍,成本最高可降低30倍,将逐步向全球用户开放。

  • 微信打击“AI代笔”:三类行为或将封号,创作者如何避雷?

    ​这一次,微信对AI内容出手了。 就在上周,#AI写作年赚200万夫妻被封号 登上微博热搜第一,引发广泛关注。 在这之前,这对夫妻在某次自媒体访谈中,称自己用AI批量生产微信公众号内容,“一年赚了200万”。有网友好奇这套商业模式的真实性,也有网友认为这种靠AI生成虚假内容的生财之道不可取。

  • 视频生成每秒仅需1元!字节Seedance2.0正式上线API服务

    今日,字节旗下火山引擎正式上线Seedance 2.0系列API服务,企业和个人用户现在可以调用其视频生成能力。 作为全球SOTA模型,Seedance 2.0支持文字、图片、音频、视频四种模态输入;同时它在复杂交互和运动场景下的可用率更高,更加贴合工业级创作场景的需求。 此外,火山引擎还为Seedance 2.0建立了肖像与版权安全标准,覆盖视频生成涉及的各种模态和创作前后的全部流程。 �

  • 全网播放量破亿的AI短片《纸手机》:可灵AI与中国式思念的一次双向奔赴”

    清明前夕,AI短片《纸手机》全网刷屏。故事讲述小男孩为怀念逝去的奶奶,用15元买“纸手机”想与奶奶视频通话。纸扎店老板用善意的谎言,以纸板手机和“信号不好”等借口温柔圆梦。短片由可灵AI生成,创作者杨选、李婷仅用三天完成。作品以孩童视角重新定义死亡:亲人不是永别,而是“去了很远的地方”。该片凭借真挚情感与细腻叙事,播放量破亿,被赞“最没人味的AI做出了最有人味的短片”。

  • 中国人工智能学会擘画智创新篇,吴文俊双会圆满落幕

    2026吴文俊人工智能创新大会暨第十五届吴文俊人工智能科学技术奖颁奖典礼在常州举行。大会聚焦国家人工智能发展战略,汇聚国内外专家、企业领袖与青年才俊,通过表彰优秀成果、学术交流与产业融合,全方位展示人工智能领域最新创新成果,探讨技术发展趋势与产业应用。大会揭晓了2025年度CAAI激励计划,并启动“智塑未来·吴奖成果江苏落地行”等活动,推动产学研深度融合,为人工智能与产业经济多领域深度合作搭建高端平台。

  • AI日报:火山引擎Seedance2.0 API全面开放;阿里巴巴首款具身机器人曝光;Skywork AI发布实时视频生成系统Matrix-Game 3.0

    本期AI日报聚焦多领域前沿动态:火山引擎Seedance 2.0 API上线,提供SOTA级视频生成能力;Skywork AI发布Matrix-Game 3.0,实现720p实时高清“世界生成”;特斯拉2026春季更新将带来Grok语音助手升级与FSD一键订阅。此外,五部门联合部署“人工智能+教育”行动,计划到2030年构建深度融合格局;爱奇艺CEO预测3-6个月内或出现AI商业大片;阿里巴巴发布首款具身四足机器人;LPM1.0模型实现单图转实时交互式数字人视频;谷歌Gemini推出基于Nano Banana技术的交互式可视化图像生成功能。

  • 阿里发布Wan2.7-Video视频生成模型!从演迈向导 聚焦创作全链路

    阿里巴巴今日正式发布Wan2.7-Video视频生成系列模型,涵盖文生视频、图生视频、参考生视频和视频编辑四大模型。 新模型拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从演”迈向导”。

今日大家都在搜的词: