首页 > 业界 > 关键词  > 可灵最新资讯  > 正文

AI日报:快手版Sora可灵开放测试;阿里悄悄开源Qwen2系列模型;Grok 1.5V或将接入Midjourney;柯南动画风AI刷屏抖音

2024-06-07 15:00 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、媲美Sora?快手文生视频模型可灵开放测试 更懂物理,最长可生成2分钟视频

快手公司推出了全新视频生成大模型「可灵」,结合了Sora技术路线和自研技术创新,能生成长达2分钟、30fps、1080p分辨率的超长视频,支持多种宽高比,模拟物理世界特性。

【AiBase提要】

💡能生成长达 2 分钟、30fps、1080p的超长视频,支持多种宽高比。

💡能准确刻画复杂运动、模拟物理特性,比如倒牛奶时的重力规律和液面上升

💡目前可灵大模型已在快影APP中开启邀测,当前版本支持生成720P视频

详细介绍及更多视频点此查看:https://mp.weixin.qq.com/s/d-hc9Ec3kse78eCwIypQdg

官网地址:https://top.aibase.com/tool/kelingdamoxing

2、阿里云通义千问开源Qwen2系列模型:性能显著提升

阿里巴巴悄悄发布了 Qwen2 系列模型,是 Qwen1.5 的重大更新,性能显著提升。模型包含5个不同规模的预训练和指令微调模型,支持处理长文本,多语言优化,表现优异。

【AiBase提要:】

✨ Qwen2系列包含5个不同规模的预训练和指令微调模型,支持处理长文本,最大上下文长度可达128K tokens。

🌍 在多语言方面做了优化,增加了27种语言的高质量数据,表现优异在自然语言理解、知识、代码、数学和多语言理解等能力上。

🚀 Qwen2持续提升在代码和数学能力方面,特别在多种编程语言和数学解题能力上有显著提升。

详情链接:https://top.aibase.com/tool/qwen2

3、X狂给壁纸流量的原因找到了!Grok 1.5V即将发布 或将接入Midjourney

最近,X平台疯狂给壁纸博主流量,让许多人羡慕不已。经过调查,发现原因在于Grok 1.5V即将发布,可能接入Midjourney,支持图像生成,让用户可以在Grok里生图并直接发布到X。这一举动解释了之前X给壁纸博主推流的原因。

image.png

【AiBase提要:】

🔍 Grok 1.5V即将发布,可能接入Midjourney,支持图像生成。

📱 xAI正努力实现Grok多模态化,允许用户上传照片获得文本回复。

💡 X平台疯狂给壁纸博主推流的原因在于Grok即将支持图像生成,提供更多创作可能性。

4、2天用户增长10万!Cara因保护艺术家作品免受AI抓取备受热捧

人工智能技术的迅速发展带来了新挑战,艺术家们担心作品被用于训练AI工具。Cara应用应运而生,为艺术家提供保护作品的平台,用户数量迅速增长。

image.png

【AiBase提要:】

🎨 Cara应用是艺术家们保护作品的新选择,限制AI使用。

🚀 Cara应用用户数量从不到10万激增至超过30万,成为热门应用。

💡 Cara应用设计融合社交媒体元素,降低用户采用障碍,引起创意人士关注。

5、700万网友用AI“转生”做侦探 柯南动画风AI特效刷屏抖音

这篇文章介绍了一款名为“柯南动画风”的AI特效在抖音上走红的现象。该特效允许用户上传照片,通过AI技术转换成《名侦探柯南》动画风格的形象,并生成视频,引发了超过700万网友的使用。这种AI特效的流行展示了AI技术在内容创作领域的潜力,为用户提供了新的娱乐方式。

image.png

【AiBase提要:】

🔥 AI特效“柯南动画风”在抖音走红,吸引700万网友使用。

# 一键式创作过程降低用户门槛,让更多人参与。

# AI技术展示在内容创作领域的潜力,为用户提供新的娱乐方式。

6、AI玩法又升级!X博主通过Runway“穿越”《模拟人生》

宝藏AI动画博主"Framer"再次展示了其创意和技术,通过AI技术实现了"穿越"体验,将自己置身于经典游戏《模拟人生》的房间中。他巧妙运用多种AI工具和创意方法,展现了精湛的动画制作技艺,呈现出极富创意的作品,彰显了AI技术在艺术创作领域的无限可能性。

【AiBase提要:】

🎨 Framer通过AI技术实现了"穿越"体验,将自己置身于《模拟人生》的房间中。

🎬 他运用Magnific、Runway等工具对房间背景和人物动作进行精细处理和融合,确保视觉效果统一。

🚀 利用Midjourney、Runway Gen-2、PS GenerativeFill等工具制作太空遨游、海上航行等场景,展示了多种AI工具的结合应用。

7、腾讯开源人像照片生成视频模型V-Express

腾讯公司开源了一款创新的模型V-Express,能够使用人像照片生成视频。该模型通过平衡不同控制信号,实现对姿态、输入图像和音频的综合控制。V-Express方法的逐步丢弃操作解决了弱信号在强信号干扰下的问题,成功实现了受音频控制的视频生成。腾讯表示将继续研究V-Express方法,促进肖像视频生成领域的发展。

image.png

【AiBase提要:】

🔑 V-Express模型能使用人像照片生成视频,通过平衡不同控制信号实现综合控制。

🚀 V-Express解决了弱信号在强信号干扰下的问题,成功实现了受音频控制的视频生成。

💡 腾讯将继续研究V-Express方法,探索其在更广泛领域的应用,促进肖像视频生成领域的发展。

详情链接:https://top.aibase.com/tool/v-express

8、DuckDuckGo引入AI Chat,提供私密聊天服务

DuckDuckGo搜索引擎推出AI Chat聊天机器人服务,承诺保护用户隐私。用户可选择不同模型进行对话,并有关闭选项。公司强调尊重用户隐私,提供匿名化访问热门AI聊天机器人的方式。

image.png

【AiBase提要:】

⭐ 用户可自由选择不同模型进行对话,包括两个专有模型和两个开源模型。

⭐ DuckDuckGo承诺保护用户隐私,不保留用户IP地址,但会临时使用网络标识符以确保安全。

⭐ 公司警告用户禁止非法活动,侵犯他人权利,创建垃圾邮件等行为,用户需承担责任。

9、高考作文人工智能上热搜:AI时代 人们的问题是否会越来越少?

这篇文章讨论了2024年高考作文题目以人工智能为核心议题,引发考生们对于技术发展与思考能力之间关系的思考。文章从多个角度探讨了人工智能对生活方式、信息传播、思考能力的影响,以及对未知世界的探索欲望。高考作文题目设计考察了考生的文学素养、写作技巧,以及对社会现象和时代变迁的敏感度和思考深度。

【AiBase提要:】

🤖 人工智能如何改变生活方式,加速信息传播和处理

🧠 技术变革是否导致思考能力退化

🌐 科技便利下如何保持对未知世界的好奇心和探索精神

10、抖音上线发评行为异常等网络水军识别模型 将打击网络水军造谣蹭热等行为

抖音近期宣布打击网络水军行为,包括造谣蹭热、侵犯隐私、低俗导流等行为。平台已上线多个网络水军识别模型,清理违规视频和评论,处罚账号超133万个,成功打击10余起案件。

【AiBase提要:】

🚫 造谣蹭热类:抖音清理同质化造谣评论,引流制造学校矛盾,持续清理不良行为。

🔍 侵犯隐私类:平台查删售卖他人隐私信息,重点封禁账号,加强技术手段,保护用户隐私。

🔞 低俗导流类:抖音屏蔽低俗暗号评论,拉黑相关账户,上报公安机关,持续打击色情服务导流。

11、AI毛毡滤镜在抖音火爆

近期,抖音平台上掀起了一股新的AI滤镜热潮,毛毡滤镜迅速走红并占据了抖音热榜。这款特效让用户将普通照片转换成具有羊毛毡手工艺质感的图像,呈现柔美、温馨的视觉效果,给人温馨治愈的感觉。AI滤镜的流行展示了审美、创意与文化内涵的结合,为用户提供丰富多彩的视觉体验。

image.png

【AiBase提要:】

✨ 毛毡滤镜走红抖音热榜,#用AI穿越奇妙毛毡世界#成为热门话题。

🌟 AI滤镜展示技术创新,体现文化和艺术内核的结合,吸引力十足。

💡 用户追求个性化创意表达,AI技术在艺术创作领域展现新可能性。

12、Adobe回应新隐私服务条款问题:不会分析本地存储内容

Adobe公司因新的隐私服务条款语言引起公众愤怒,用户对其可能对内容进行监控和AI训练表示担忧。Adobe回应称不会访问用户设备上存储的内容,但会分析上传至其云端服务的内容。

image.png

【AiBase提要:】

⭐ 用户对Adobe可能对其内容进行监控和AI训练表示担忧。

⭐ Adobe回应称不会访问用户设备上存储的内容,但会分析上传至其云端服务的内容。

⭐ Adobe的新隐私服务条款引发用户不满,部分用户表示取消订阅意愿。

13、Galileo发布Luna,重新定义GenAI评估

Galileo最新推出的Luna Evaluation Foundation Models彻底改变了企业对GenAI系统评估的方式,大幅提升了速度、降低成本,同时提高准确性。这一革命性产品将为企业带来全新的评估体验。

【AiBase提要:】

⭐ Luna Evaluation Foundation Models重新定义了企业GenAI评估,提升速度、降低成本,提高准确性。

⭐ Luna的创新核心在于专为特定评估任务设计的小型语言模型,极大简化了评估流程。

⭐ Luna超越了竞争对手,AUROC得分达到0.78,在准确性方面表现卓越。

详情链接:https://www.rungalileo.io/blog/introducing-galileo-luna-a-family-of-evaluation-foundation-models

举报

  • 相关推荐
  • 大家在看
  • Gobi:个性化情绪健康指导APP

    Gobi是一款致力于提供个性化情绪健康指导的应用程序。它由一群对AI充满热情的团队开发,团队成员来自Google、Microsoft、Meta和Scale AI等知名公司。Gobi通过实时生成基于科学的语音指导健康实践,帮助用户管理情绪健康。产品的主要优点包括全天候的人性化健康支持、适应性AI个性化、实时健康实践生成、日常检查和情绪健康跟踪等。

  • DiT-MoE:大规模参数扩散变换器模型

    DiT-MoE是一个使用PyTorch实现的扩散变换器模型,能够扩展到160亿参数,与密集网络竞争的同时展现出高度优化的推理能力。它代表了深度学习领域在处理大规模数据集时的前沿技术,具有重要的研究和应用价值。

  • Picogen AI Image API:AI图像生成API,提供高质量的4K图像生成和编辑功能。

    Picogen AI Image API是一个领先的AI图像生成平台,提供与Midjourney, Stable Diffusion和DALL-E相媲美的高质量图像生成服务。它支持生成高达4K分辨率的图像,并且具备图像合并、背景移除和8K分辨率的图像放大等高级功能。Picogen旨在为数字营销人员、平面设计师、内容创作者等专业人士提供强大的视觉内容创作工具。

  • Colocio AI:一站式在线营销工具,由AI驱动,简化广告和内容创作。

    Colocio AI是一款集成了人工智能技术的在线营销工具,旨在帮助用户创建、评估和自动化在线广告活动。它通过AI技术生成高转化率的广告文案和社交媒体内容,提供无障碍的内容调度功能,以及实时的AI辅助和数据驱动的报告,帮助用户优化广告活动,提高性能。Colocio AI的背景是简化内容和媒体创作流程,专注于为品牌和目标受众量身定制内容,同时释放用户时间,让他们专注于战略规划和与受众互动,推动业务创新和增长。

  • Supermemory.ai:你的个人数字第二大脑

    Supermemory是一个致力于帮助用户组织、搜索和利用保存信息的平台。它提供强大的工具,如搜索引擎、写作助手和画布,旨在成为用户的个人第二大脑。它注重隐私保护,可在任何地方工作,支持自托管,并且价格亲民,提供免费层级。

  • Dialed:个性化AI激励演讲,激发潜能。

    Dialed是一款AI驱动的应用程序,旨在通过个性化的激励演讲来激发用户的潜能。无论是健身、演讲还是日常挑战,Dialed都能提供个性化的激励和启发。产品的主要优点包括个性化的激励演讲、真诚的支持、传奇的演讲定制、多种声音选择、背景音乐以及AI生成的激励图像。此外,Dialed还允许用户将激励演讲分享给朋友和家人。

  • Aphrodite-engine:PygmalionAI的大规模推理引擎

    Aphrodite是PygmalionAI的官方后端引擎,旨在为PygmalionAI网站提供推理端点,并允许以极快的速度为大量用户提供Pygmalion模型服务。Aphrodite利用vLLM的分页注意力技术,实现了连续批处理、高效的键值管理、优化的CUDA内核等特性,支持多种量化方案,以提高推理性能。

  • ICSFSurvey:深入研究大型语言模型的内部一致性和自我反馈

    ICSFSurvey是一个关于大型语言模型内部一致性和自我反馈的调查研究。它提供了对LLMs自我评估和自我更新机制的统一视角,包括理论框架、系统分类、评估方法、未来研究方向等。

  • Stable Audio Open demo:从文本提示生成立体声音频

    Stable Audio Open 是一个能够从文本提示生成长达47秒的立体声音频的技术。它包含三个主要组件:一个将波形压缩到可管理序列长度的自编码器、一个基于T5的文本嵌入用于文本条件、以及一个在自编码器的潜在空间中操作的基于变换的扩散(DiT)模型。该技术在生成音频方面表现出色,能够根据文本提示生成各种类型的音频,如打击乐、电子音乐、自然声音等。

  • Claude Engineer:利用Anthropic的Claude模型辅助软件开发任务的高级命令行界面。

    Claude Engineer是一个高级的命令行界面,它利用Anthropic的Claude 3和Claude 3.5模型的能力,来协助完成广泛的软件开发任务。这个工具无缝地结合了最先进大型语言模型的能力与实用的文件系统操作、网页搜索功能、智能代码分析和执行能力。

  • Aiuni:探索3D虚拟世界,体验梦想家宇宙。

    Aiuni是一个提供3D虚拟世界体验的平台,用户可以在这里创建和探索个性化的3D模型,享受沉浸式的宇宙探索之旅。Aiuni以其创新的3D技术、丰富的互动性和高度的个性化定制,为用户提供了一个全新的虚拟体验空间。

  • Morphic.com:创新故事讲述的未来,使用突破性技术。

    Morphic Studio是一个利用先进人工智能技术,为创意产业带来革命性变化的在线平台。它提供了从构思到最终故事的全面工具,包括画布(Canvas)和视频编辑器,以及Morphic Playground,允许用户通过简单的消息创建资产。Morphic Studio旨在为创意专业人士,如游戏设计师和电影制作人,提供工具,以减少产品上市时间,并提高创作效率。

  • RapidOCR:快速、多语言支持的OCR工具包

    RapidOCR是一个基于ONNXRuntime、OpenVINO和PaddlePaddle的OCR多语言工具包。它将PaddleOCR模型转换为ONNX格式,支持Python/C++/Java/C#等多平台部署,具有快速、轻量级、智能的特点,并解决了PaddleOCR内存泄露的问题。

  • 百度智金・金融智能体:依托大模型技术,助力金融智能化转型,降本增效。

    智金・金融智能体是基于百度领先的大模型技术,结合多年的金融行业知识,专为金融从业人员设计的智能化解决方案。该产品通过智能化的咨询、交易引导和报告生成等功能,旨在提升金融业务的效率与合规性,帮助用户在信贷、投资、监管和保险等多个场景实现数字化转型。定位为金融行业的智能助手,智金・金融智能体通过 AI 技术为客户提供了高效、准确的支持,降低了人力成本并提高了服务质量。其背景源自百度在 AI 领域的深厚积累,价格策略灵活,具体情况可咨询客服。

  • Proton Scribe:智能隐私优先的邮件写作助手

    Proton Scribe是一个集成在Proton Mail中的智能写作助手,它以隐私优先,可以帮助用户撰写和润色邮件草稿,节省撰写邮件的时间,同时保护最敏感、最有价值的数据。Proton Scribe设计为本地运行,确保用户数据不会离开设备。Proton一直致力于研究保护隐私的AI技术,并在2023年推出了Proton Sentinel,这是第一个利用AI提供增强账户保护的功能。Proton Scribe也是开源的,可以进行独立的安全和隐私审计。

  • Dialog AI:先进的对话式AI面试平台,提升招聘效率。

    Dialog AI 是一个利用人工智能技术进行面试的在线平台,它通过自动化面试安排、实时AI面试和即时反馈报告,帮助企业简化招聘流程,提高面试效率和候选人满意度。该平台支持24/7的面试安排,确保公平一致的面试过程,并提供定制化的反馈报告,帮助企业做出更有信心的招聘决策。

  • ENSTANT 智云即弹:全档位AI吉他,让音乐创作更自由。

    ENSTANT 智云即弹是一款结合人工智能技术的吉他学习与创作应用,它通过模拟真实吉他的演奏体验,为用户提供了一种全新的音乐创作和学习方式。该产品利用先进的AI算法,能够即时生成和弦和旋律,帮助用户快速掌握吉他演奏技巧,激发音乐创作灵感。智云即弹以其创新性、易用性和强大的功能,为吉他爱好者和音乐创作者提供了一个便捷的音乐创作平台。

  • AI文本检测器:确保文本原创性,防止抄袭的AI检测工具。

    AI文本检测器是一款专业的AI检测工具,利用先进的AI技术,为用户提供文本原创性检测服务。它通过多种检测模型,如Chatgpt Detector Roberta、Roberta-Large OpenAI Detector和Roberta Academic Detector,确保检测结果的准确性和可靠性。该工具不仅免费使用,还支持多语言,响应速度快,并且强调用户隐私和数据安全。

  • story-writing:使用LangGraph代理帮助用户编写故事

    story-writing是一个基于LangGraph Cloud的应用程序,旨在以一种有趣且互动的方式展示LangGraph Cloud的功能。该应用程序允许用户在LangGraph代理的帮助下编写故事,用户可以编辑已经写好的章节,或者继续编写下一章。用户可以有多个相同章节编号的版本,并选择他们最喜欢的版本继续故事。在开始时,用户提供故事摘要、所需的写作风格和对故事重要的任何其他细节。从那时起,他们只需要提供编辑和继续指令,以引导代理朝期望的方向发展。注意:这个应用程序是一个原型,尚未准备好部署,可能会有bug或代理的输出结果不佳。

  • Zenquiz:智能生成考试复习题

    Zenquiz是一款将学习笔记转换为考试复习题的在线工具。它利用AI技术帮助学生、教师和企业用户提高学习效率和教学体验,通过个性化的选择题、判断题和填空题来强化记忆并准备考试。产品背景是教育领域的数字化转型,主要优点包括个性化学习、节省时间、增强记忆和提升参与度。

今日大家都在搜的词:

热文