首页 > 业界 > 关键词  > Pika1.0最新资讯  > 正文

AI视野:Pika1.0正式向所有人开放;阿里开源文生3D模型;Midjourney V6涉嫌侵权;谷歌推出新AI SDK

2023-12-26 15:22 · 稿源:站长之家

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

Pika1.0正式向所有人开放

Pika1.0官方宣布正式向所有人开放网页版本试用资格,每个用户都可免费体验该创意视频制作平台。该版本以文生成视频为特色,提供3秒视频快速生成和背景修改等功能,尤其擅长动漫风格的动物生成。虽然部分用户反映生成效果与宣传有差距,但阶段性免费使用提供机会。

image.png

【AiBase提要:】

😊 Pika1.0正式开放网页版试用,允许每个用户免费体验。

😎 以文生成视频为特色,提供3秒视频快速生成和背景修改等功能。

👍 特长于生成动漫风格的动物,用户可轻松体验宫崎骏画风。

LeonardoAI视频生成功能正式向所有用户推出

LeonardoAI图像生成工具推出视频生成功能,基于SVD技术,免费试用,上周获3100万美元融资,用户数量已达700万。

QQ截图20231225161813.png

官网地址:https://top.aibase.com/tool/leonardo-ai

【AiBase提要:】

🚀 LeonardoAI图像生成工具发布视频生成功能,基于SVD技术,效果优于Runway,但仅支持使用内部工具生成的图片生成视频。

💰 上周LeonardoAI获3100万美元融资,投资方包括Blackbird、Side Stage Ventures等。

👥 LeonardoAI用户数量已达700万,总生成图像超过7亿张,服务创意行业如游戏、广告、时尚和建筑。

🤖📈💻💡大模型动态

阿里开源文生3D模型

阿里通义实验室的XR实验室开源了文生3D新模型,能通过文本描述生成对应的3D模型及纹理,包括Text-to-ND和Text-to-ND-MV两个大模型。为满足不同需求,开源了基础版本和Multi-View版本,并提供了优化代码,实现文本直接到3D模型的生成。

微信截图_20231226082207.png

Text-to-ND、Text-to-ND-MV大模型:

https://modelscope.cn/models/Damo_XR_Lab/Normal-Depth-Diffusion-Model/summary

【AiBase提要:】

🌐 多模型开源: 阿里通义XR实验室发布Text-to-ND和Text-to-ND-MV两大3D模型,满足不同算法开发需求。

🛠️ 开发者支持: 提供基础版本和Multi-View版本,以及优化代码,方便开发者生成文本描述对应的3D模型。

🔗 模型链接: 可通过链接获取Text-to-ND和Text-to-ND-MV大模型,促进3D模型生成技术的应用。

天工SkyAgents正式开放测试

昆仑万维推出基于「天工大模型」的AI Agents开发平台「天工SkyAgents」,支持用户通过自然语言构建私人助理,实现模块化任务执行,推动大模型技术普及。

微信截图_20231225161544.png

【AiBase提要:】

🚀 技术基础: 「天工 SkyAgents」基于昆仑万维的「天工大模型」,具备自主学习和独立思考能力。

🤖 任务模块化: 用户可通过自然语言构建私人助理,将不同任务模块化,实现执行各种任务。

🌐 推动普及化: 平台推动大模型技术普及,助力个人和中小企业积极拥抱先进的AI技术。

Cyanpuppets1.5本周五发布

Cyanpuppets的最新版本1.50将于本周五发布,采用迄今最大的训练数据集和最通用的算法模型,允许用户仅用两个网络摄像头实时快速创建3D舞蹈内容。

image.png

地址:https://cyanpuppets.myshopify.com/

【AiBase提要】

🚀 创新功能: Cyanpuppets1.5版本采用最大的训练数据集和通用算法,用户可轻松实时创建3D舞蹈内容。

💡 技术核心: Cyanpuppets公司以卷积神经网络和深度神经网络为核心,结合NVIDIA GPU算力,实现2D视频生成3D动作数据。

🌐 公司背景: Cyanpuppets的公司青色木偶科技是国内领先的人工智能图像算法技术和实时渲染平台工具提供商。

📰🤖📢AI新鲜事

Midjourney最新V6版本涉嫌版权侵权引发争议

Midjourney最新V6版本的文本生成器被指涉嫌版权侵权,用户测试发现生成的图像与多部电影场景高度相似,引起艺术家抱怨并遭到封禁。

【AiBase提要】

🔍 Midjourney最新V6版本升级,用户抱怨生成图像过于相似于受版权保护的艺术品。

🎨 艺术家测试发现生成的图像几乎与多部电影场景一模一样,遭到封禁。

🤖 AI研究者Gary Marcus关注指控,公司未回应是否使用高分辨率版权图像进行训练。

戴尔携手AMD扩大生成式人工智能产品线

戴尔宣布推出搭载AMD Instinct MI300X AI加速器的高性能计算服务器,与Nvidia竞争,强调多元选择、开放标准,并发布"Dell Validated Design for Generative AI"标准。

【AiBase提要:】

🔄 多元选择: 戴尔推出PowerEdge XE9680服务器,搭载AMD Instinct MI300X AI加速器,与Nvidia版本齐头并进,为客户提供更多人工智能工作负载选择。

🌐 开放标准: 戴尔加入Ultra Ethernet Consortium,与Nvidia不同,倡导开放计算、互操作性,推动采用基于标准的网络。

💻 新标准推出: 戴尔发布"Dell Validated Design for Generative AI with AMD"标准,为企业提供硬件和网络架构框架,支持大型语言模型(LLMs)的运行。

AI技术可鉴定奢侈品真伪,准确率达到99.1%

科技公司Entrupy宣称其AI技术能以99.1%的准确率检测二手奢侈品真伪,通过智能手机插入硬件设备拍摄照片,并与数百万真品库存图片进行比对。

【AiBase提要】:

🤖 Entrupy的AI设备可几乎完美地检测二手奢侈品真伪,尤其对品牌如路易威登和香奈儿的产品,准确率达99.1%。

📸 使用AI鉴定器,用户需将智能手机插入Entrupy硬件设备,从各个角度拍摄产品照片,通过微型镜头进行细节鉴定。

🌐 此AI技术引起广泛关注,尤其是在TikTok与Entrupy合作,用于鉴别TikTok Shop上的产品真伪,加强奢侈品转售商与消费者的信任。

英国法官可以用ChatGPT写裁决书了

英国法官可使用ChatGPT起草法律裁决书,相关官方指南详细规定正确使用方法、潜在风险及示例,标志着司法领域对生成式AI的认可。

【AiBase提要:】

📜 法官使用指南发布: 英国允许法官使用ChatGPT起草法律裁决书,并发布详细指南,适用于司法机构的官员、员工。

🚨 潜在风险与注意事项: 指南强调使用ChatGPT等生成式AI需谨慎,警告可能存在的不准确性和局限性,提醒法官避免过度依赖公共生成式AI产品。

🌐 司法认可与未来展望: 此举标志着司法领域对生成式AI的认可,未来将继续完善相关指南,以促进正确、负责任的AI使用。

谷歌推出新AI SDK

近日发布了其新的 Google AI SDK,旨在简化在安卓应用中集成其迄今为止表现最佳的模型Gemini Pro。使用此 SDK,开发者无需构建和管理自己的后端基础设施。

【AiBase提要:】

🚀 Google发布新的AI SDK,简化在安卓应用中集成表现最佳的Gemini Pro模型,支持广泛的文本和图像推理任务。

🔄 Google AI SDK使开发者无需构建和管理后端基础设施,提供安卓应用的客户端SDK,包装Gemini REST API为惯用的Kotlin API。

💡除了Gemini Pro,Google还推出较小的模型Gemini Nano,可在设备端运行,通过AICore简化在安卓应用中集成AI。

印度将建立人工智能气候模型

印度气象部门计划引入人工智能技术建立气候模型,以提高严重天气事件的预测准确性,减少损失和风险。

【AiBase提要:】

🌐 技术引入: 印度气象部门将利用人工智能技术建立气候模型,提供更高质量、更便宜的天气数据。

🌀 事件预测: 人工智能气候模型通过机器学习和大数据分析,能够提前识别和分析气象数据中的模式,帮助预测暴雨、洪水等严重天气事件。

🚀 科技发展: 这一举措将推动印度在气象领域的科技发展,提升国家的灾害应对能力,为公众和政府提供更准确可靠的天气预报和警报。

Infosys 宣布终止价值15亿美元的全球客户人工智能技术合同

Infosys宣布终止价值15亿美元的全球客户人工智能技术合同,未透露客户细节和终止原因,这对业务和员工可能产生深远影响。

【AiBase提要:】

🔍 Infosys宣布终止15亿美元全球客户AI合同。

💼 交易预计每年为Infosys带来1亿美元收入,为期15年。

💔 终止可能在当前市场不确定性下对业务和人员造成影响。

👨‍💻💡🎯聚焦开发者

南洋理工开源Upscale-A-Video

新加坡南洋理工大学的Upscale-A-Video框架通过文本提示、时序U-Net和循环潜码等创新方法,解决大模型生成视频中的不连贯、模糊、掉帧等问题,提供高质量视频超分辨率。

图片

【AiBase提要】

🎥 Upscale-A-Video框架解决大模型生成视频的问题,融合文本提示、时序U-Net和循环潜码,提供超分辨率、去噪、还原等功能。

🌐 通过扩散方法,局部和全局两种策略维持时间一致性,保证长视频整体连贯性。

👾 文本提示可指导细节纹理生成,时序U-Net和循环潜码模块共同优化视频质量,实验证明在峰值信噪比和感知损失上优势明显。

论文地址:https://arxiv.org/abs/2312.06640

开源地址:https://github.com/sczhou/Upscale-A-Video

项目地址:https://shangchenzhou.com/projects/upscale-a-video/

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词: