首页 > 业界 > 关键词  > Pika1.0最新资讯  > 正文

AI视野:Pika1.0正式向所有人开放;阿里开源文生3D模型;Midjourney V6涉嫌侵权;谷歌推出新AI SDK

2023-12-26 15:22 · 稿源:站长之家

新鲜AI产品点击了解https://top.aibase.com/

🤖📱💼AI应用

Pika1.0正式向所有人开放

Pika1.0官方宣布正式向所有人开放网页版本试用资格,每个用户都可免费体验该创意视频制作平台。该版本以文生成视频为特色,提供3秒视频快速生成和背景修改等功能,尤其擅长动漫风格的动物生成。虽然部分用户反映生成效果与宣传有差距,但阶段性免费使用提供机会。

image.png

【AiBase提要:】

😊 Pika1.0正式开放网页版试用,允许每个用户免费体验。

😎 以文生成视频为特色,提供3秒视频快速生成和背景修改等功能。

👍 特长于生成动漫风格的动物,用户可轻松体验宫崎骏画风。

LeonardoAI视频生成功能正式向所有用户推出

LeonardoAI图像生成工具推出视频生成功能,基于SVD技术,免费试用,上周获3100万美元融资,用户数量已达700万。

QQ截图20231225161813.png

官网地址:https://top.aibase.com/tool/leonardo-ai

【AiBase提要:】

🚀 LeonardoAI图像生成工具发布视频生成功能,基于SVD技术,效果优于Runway,但仅支持使用内部工具生成的图片生成视频。

💰 上周LeonardoAI获3100万美元融资,投资方包括Blackbird、Side Stage Ventures等。

👥 LeonardoAI用户数量已达700万,总生成图像超过7亿张,服务创意行业如游戏、广告、时尚和建筑。

🤖📈💻💡大模型动态

阿里开源文生3D模型

阿里通义实验室的XR实验室开源了文生3D新模型,能通过文本描述生成对应的3D模型及纹理,包括Text-to-ND和Text-to-ND-MV两个大模型。为满足不同需求,开源了基础版本和Multi-View版本,并提供了优化代码,实现文本直接到3D模型的生成。

微信截图_20231226082207.png

Text-to-ND、Text-to-ND-MV大模型:

https://modelscope.cn/models/Damo_XR_Lab/Normal-Depth-Diffusion-Model/summary

【AiBase提要:】

🌐 多模型开源: 阿里通义XR实验室发布Text-to-ND和Text-to-ND-MV两大3D模型,满足不同算法开发需求。

🛠️ 开发者支持: 提供基础版本和Multi-View版本,以及优化代码,方便开发者生成文本描述对应的3D模型。

🔗 模型链接: 可通过链接获取Text-to-ND和Text-to-ND-MV大模型,促进3D模型生成技术的应用。

天工SkyAgents正式开放测试

昆仑万维推出基于「天工大模型」的AI Agents开发平台「天工SkyAgents」,支持用户通过自然语言构建私人助理,实现模块化任务执行,推动大模型技术普及。

微信截图_20231225161544.png

【AiBase提要:】

🚀 技术基础: 「天工 SkyAgents」基于昆仑万维的「天工大模型」,具备自主学习和独立思考能力。

🤖 任务模块化: 用户可通过自然语言构建私人助理,将不同任务模块化,实现执行各种任务。

🌐 推动普及化: 平台推动大模型技术普及,助力个人和中小企业积极拥抱先进的AI技术。

Cyanpuppets1.5本周五发布

Cyanpuppets的最新版本1.50将于本周五发布,采用迄今最大的训练数据集和最通用的算法模型,允许用户仅用两个网络摄像头实时快速创建3D舞蹈内容。

image.png

地址:https://cyanpuppets.myshopify.com/

【AiBase提要】

🚀 创新功能: Cyanpuppets1.5版本采用最大的训练数据集和通用算法,用户可轻松实时创建3D舞蹈内容。

💡 技术核心: Cyanpuppets公司以卷积神经网络和深度神经网络为核心,结合NVIDIA GPU算力,实现2D视频生成3D动作数据。

🌐 公司背景: Cyanpuppets的公司青色木偶科技是国内领先的人工智能图像算法技术和实时渲染平台工具提供商。

📰🤖📢AI新鲜事

Midjourney最新V6版本涉嫌版权侵权引发争议

Midjourney最新V6版本的文本生成器被指涉嫌版权侵权,用户测试发现生成的图像与多部电影场景高度相似,引起艺术家抱怨并遭到封禁。

【AiBase提要】

🔍 Midjourney最新V6版本升级,用户抱怨生成图像过于相似于受版权保护的艺术品。

🎨 艺术家测试发现生成的图像几乎与多部电影场景一模一样,遭到封禁。

🤖 AI研究者Gary Marcus关注指控,公司未回应是否使用高分辨率版权图像进行训练。

戴尔携手AMD扩大生成式人工智能产品线

戴尔宣布推出搭载AMD Instinct MI300X AI加速器的高性能计算服务器,与Nvidia竞争,强调多元选择、开放标准,并发布"Dell Validated Design for Generative AI"标准。

【AiBase提要:】

🔄 多元选择: 戴尔推出PowerEdge XE9680服务器,搭载AMD Instinct MI300X AI加速器,与Nvidia版本齐头并进,为客户提供更多人工智能工作负载选择。

🌐 开放标准: 戴尔加入Ultra Ethernet Consortium,与Nvidia不同,倡导开放计算、互操作性,推动采用基于标准的网络。

💻 新标准推出: 戴尔发布"Dell Validated Design for Generative AI with AMD"标准,为企业提供硬件和网络架构框架,支持大型语言模型(LLMs)的运行。

AI技术可鉴定奢侈品真伪,准确率达到99.1%

科技公司Entrupy宣称其AI技术能以99.1%的准确率检测二手奢侈品真伪,通过智能手机插入硬件设备拍摄照片,并与数百万真品库存图片进行比对。

【AiBase提要】:

🤖 Entrupy的AI设备可几乎完美地检测二手奢侈品真伪,尤其对品牌如路易威登和香奈儿的产品,准确率达99.1%。

📸 使用AI鉴定器,用户需将智能手机插入Entrupy硬件设备,从各个角度拍摄产品照片,通过微型镜头进行细节鉴定。

🌐 此AI技术引起广泛关注,尤其是在TikTok与Entrupy合作,用于鉴别TikTok Shop上的产品真伪,加强奢侈品转售商与消费者的信任。

英国法官可以用ChatGPT写裁决书了

英国法官可使用ChatGPT起草法律裁决书,相关官方指南详细规定正确使用方法、潜在风险及示例,标志着司法领域对生成式AI的认可。

【AiBase提要:】

📜 法官使用指南发布: 英国允许法官使用ChatGPT起草法律裁决书,并发布详细指南,适用于司法机构的官员、员工。

🚨 潜在风险与注意事项: 指南强调使用ChatGPT等生成式AI需谨慎,警告可能存在的不准确性和局限性,提醒法官避免过度依赖公共生成式AI产品。

🌐 司法认可与未来展望: 此举标志着司法领域对生成式AI的认可,未来将继续完善相关指南,以促进正确、负责任的AI使用。

谷歌推出新AI SDK

近日发布了其新的 Google AI SDK,旨在简化在安卓应用中集成其迄今为止表现最佳的模型Gemini Pro。使用此 SDK,开发者无需构建和管理自己的后端基础设施。

【AiBase提要:】

🚀 Google发布新的AI SDK,简化在安卓应用中集成表现最佳的Gemini Pro模型,支持广泛的文本和图像推理任务。

🔄 Google AI SDK使开发者无需构建和管理后端基础设施,提供安卓应用的客户端SDK,包装Gemini REST API为惯用的Kotlin API。

💡除了Gemini Pro,Google还推出较小的模型Gemini Nano,可在设备端运行,通过AICore简化在安卓应用中集成AI。

印度将建立人工智能气候模型

印度气象部门计划引入人工智能技术建立气候模型,以提高严重天气事件的预测准确性,减少损失和风险。

【AiBase提要:】

🌐 技术引入: 印度气象部门将利用人工智能技术建立气候模型,提供更高质量、更便宜的天气数据。

🌀 事件预测: 人工智能气候模型通过机器学习和大数据分析,能够提前识别和分析气象数据中的模式,帮助预测暴雨、洪水等严重天气事件。

🚀 科技发展: 这一举措将推动印度在气象领域的科技发展,提升国家的灾害应对能力,为公众和政府提供更准确可靠的天气预报和警报。

Infosys 宣布终止价值15亿美元的全球客户人工智能技术合同

Infosys宣布终止价值15亿美元的全球客户人工智能技术合同,未透露客户细节和终止原因,这对业务和员工可能产生深远影响。

【AiBase提要:】

🔍 Infosys宣布终止15亿美元全球客户AI合同。

💼 交易预计每年为Infosys带来1亿美元收入,为期15年。

💔 终止可能在当前市场不确定性下对业务和人员造成影响。

👨‍💻💡🎯聚焦开发者

南洋理工开源Upscale-A-Video

新加坡南洋理工大学的Upscale-A-Video框架通过文本提示、时序U-Net和循环潜码等创新方法,解决大模型生成视频中的不连贯、模糊、掉帧等问题,提供高质量视频超分辨率。

图片

【AiBase提要】

🎥 Upscale-A-Video框架解决大模型生成视频的问题,融合文本提示、时序U-Net和循环潜码,提供超分辨率、去噪、还原等功能。

🌐 通过扩散方法,局部和全局两种策略维持时间一致性,保证长视频整体连贯性。

👾 文本提示可指导细节纹理生成,时序U-Net和循环潜码模块共同优化视频质量,实验证明在峰值信噪比和感知损失上优势明显。

论文地址:https://arxiv.org/abs/2312.06640

开源地址:https://github.com/sczhou/Upscale-A-Video

项目地址:https://shangchenzhou.com/projects/upscale-a-video/

举报

  • 相关推荐
  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • 鸿蒙微信更新:版本号从1.0跃升至8.0 看齐安卓iOS

    今天,鸿蒙版微信迎来更新,其版本号从原来的1.0.10.36直接跃升至8.0.11.34,看齐iOS和安卓。PS:iOS和安卓版微信当前版本号为8.0.64。 微信员工客村小蒋表示,最新的鸿蒙微信正式版上架应用商店,从这个版本开始,我们的版本号从1.0.x变更为了8.0.x,比如这一次就从8.0.11开始。 最初上架为什么从1.0.x开始

  • M6 iPad Pro将加入VC散热:向iPhone 17 Pro看齐

    随着芯片性能的不断提升,苹果计划为iPad Pro配备VC散热系统,消费者最快会在M6 iPad Pro上看到。 Mark Gurman指出,如果iPhone与iPad Pro配备VC散热系统的尝试取得成功,苹果后续可能会将该技术应用到MacBook Air等其他被动散热设备上。 目前苹果对iPad Pro的更新周期约为18个月,因此下一代iPad Pro预计将在2027年春季发布。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 苹果iPad mini将支持防水:看齐iPhone

    苹果正研发新一代防水iPad mini,采用无扬声器开孔设计降低进水风险,防水性能接近iPhone。与iPhone采用粘合剂密封不同,iPad mini通过全新扬声器系统实现防水。现售款无官方防水认证,而新款预计2026年上市,可能搭载OLED屏幕并涨价约100美元(现起售价499美元)。

  • Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

    Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

  • OPPO ColorOS 16正式版推送:首批适配11款机型

    ColorOS 16正式版于10月30日启动推送,首批覆盖11款OPPO和一加热门机型。该系统引入极光引擎、潮汐引擎与繁星编译器三大流畅技术,实现感官、性能与底层的全方位提升。极光引擎打造业内首个“无缝隙架构”,确保全场景丝滑交互;潮汐引擎首发芯片级动态追帧技术,系统重载流畅度提升37%,功耗降低13%;繁星编译器首创安卓跨级融合编译技术,大幅提升低算力芯片性能。此次升级将增强品牌市场竞争力,为用户带来更出色的使用体验。

  • iPhone 18 Pro迎双重升级:主摄和长焦脱胎换骨

    iPhone 18 Pro系列影像将迎来双重升级。 首先是主摄,爆料称iPhone 18 Pro系列主摄支持可变光圈,这将是苹果史上第一款支持可变光圈的机型。 据悉,可变光圈技术是通过物理调节镜头光圈大小来控制相机传感器的进光量。在暗光环境下,光圈开大能接收更多光线;在明亮场景中,光圈缩小防止过度曝光。这项技术的核心优势在于让用户能够像使用专业相机一样,自主选择光圈�

  • Pika向候补名单发放资格 快看看你是不是第一批Pika1.0用户!

    美国AI初创公司PikaLabs发布了其首款视频生成产品Pika1.0,由于生成效果惊艳,该产品迅速在网络走红。加入候补名单后,网友们都望眼欲穿,只想尽快体验一番。作为一款文生视频工具,Pika1.0的主要功能包括:输入文字即可快速生成时长3秒的视频,对现有视频的背景、其中的道具进行局部修改以及改变视频的尺寸等功能。

  • Pika1.0有哪些功能 图片转视频AI生成器推荐

    PIKA视频软件是一款可以根据文本或图像生成视频的AI工具。它可以让你用文字描述你想要的场景,或者上传你自己的图片,然后生成动态的视频。以上就是PIKA1.0的全部介绍了,感兴趣的小伙伴可以点击上方链接前往体验。

今日大家都在搜的词: