首页 > 业界 > 关键词  > 可灵最新资讯  > 正文

AI日报:快手启动“可灵AI”导演共创计划;Fluxgym傻瓜式训练FLUX Lora;弱智吧成中文AI训练“金矿”;美国法官用AI解读法律

2024-09-09 14:53 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、快手启动“可灵AI”导演共创计划 将创作 9 部约 3 分钟AIGC电影短片

快手公司宣布启动“可灵AI”导演共创计划,这标志着影视行业与人工智能技术的深度融合迈入了新阶段。该计划将邀请李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等九位知名导演,利用快手自研的“可灵AI”视频生成技术,共同创作 9 部AIGC(人工智能生成内容)电影短片。

微信截图_20240909150057.png

【AiBase 提要:】

🎬 快手推出 “可灵 AI” 计划,将创作 9 部 AIGC 电影短片。

🎥 九位知名导演将利用 “可灵 AI” 技术进行创作。

🤖 “可灵 AI” 已服务 160 万用户,生成众多影像和视频。

2、12G显存就能玩转AI模型训练?Fluxgym让FLUX Lora训练变傻瓜式操作

在人工智能领域,Fluxgym的出现正在改变模型训练的高门槛,为AI爱好者们打开了一扇通往模型训练世界的大门。其简单易用的特性引起了广泛关注,让更多人能参与到AI模型训练中。Fluxgym结合了简洁前端和强大后端,简化了训练流程,对低配置设备友好,让新手也能快速上手体验模型训练乐趣。

image.png

【AiBase提要:】

🔑 低硬件要求:Fluxgym只需12GB显存即可开启AI模型训练,降低了硬件门槛,让更多人参与。

💻 简化操作:用户只需完成简单的输入信息-选择图片-点击开始三个步骤即可启动训练过程,降低了操作复杂度。

🚀 推动AI民主化:Fluxgym的推出将促进AI爱好者参与模型训练,推动FLUX Lora模型的发展,为更广泛的用户群体打开AI世界的大门。

详情链接:https://github.com/cocktailpeanut/fluxgym

3、弱智吧成最受欢迎中文AI训练数据库

在人工智能快速发展的今天,百度贴吧的弱智吧意外成为AI训练的重要数据来源,引发科技圈和网络社区广泛关注。弱智吧的段子训练AI展现出惊人价值,挑战传统数据认知。社区成员创作的段子锻炼AI对中文的理解和推理能力,成为人类智慧和AI之间的一道防线。

【AiBase提要:】

🤖 弱智吧成为AI训练重要数据来源,表现超越知名平台,颠覆传统数据认知。

🧠 弱智吧的段子锻炼AI对中文的理解和推理能力,让机器更像人类进行交流。

😂 弱智吧的幽默感成为区分人类智慧和人工智能的关键所在。

详情:https://www.aibase.com/zh/news/11622

4、AI聊天机器人走上法庭!这美国法官用竟用GPT-4、Claude等AI解读法律

这篇文章介绍了美国第11巡回上诉法院的法官凯文・纽森首次利用聊天机器人来帮助解读法律术语的“普通含义”,为案件提供新视角。纽森认为聊天机器人可以作为传统法律工具的补充,帮助更好地理解语言的日常用法。

【AiBase提要:】

🤖 法官凯文・纽森利用聊天机器人来探讨法律术语的“普通含义”,为案件提供新视角。

⚖️ 此案聚焦持枪抢劫的行为是否构成“身体约束”,纽森法官认为仅用枪指不应算作约束。

📚 纽森认为聊天机器人可以作为传统法律工具的补充,帮助更好地理解语言的日常用法。

5、AI 设计引爆商机:墨西哥创业团队凭借一张AI球衣设计图牵手阿迪达斯

在墨西哥城,一个名为"某处某人"的创业团队凭借人工智能设计的足球队服,成功吸引了全球运动品牌巨头阿迪达斯的目光,实现了一次跨越式的商业合作。这个故事不仅展示了科技创新与传统手工艺的完美融合,更彰显了社会企业在推动可持续发展和扶贫方面的巨大潜力。

image.png

【AiBase提要:】

🚀 创业团队某处某人利用人工智能设计的足球队服吸引了全球运动品牌巨头阿迪达斯的目光,实现了商业合作。

💡 AI技术的应用极大地提升了某处某人的设计效率和创新能力,月设计能力从10个产品飙升至5000个,收入增长了36倍。

🤝 某处某人通过与Nimble的合作,成功将产品打入全球苹果商店,展示了社会企业模式的广泛认可。

6、Mini-Omni:开启边思考边说话新时代的多模态AI模型

Mini-Omni是一款开源多模态大型语言模型,具有实时语音处理能力和边思考边说话的独特能力,为用户带来自然交互体验。它支持多种输入模态,包括语音和文本,展现出全面的实力和强大的潜力。Mini-Omni的 Any Model Can Talk 功能使得其他AI模型能够集成其实时语音能力,扩展了AI应用的可能性。

【AiBase提要:】

🔊 实时语音处理能力和边思考边说话的独特能力

🤖 多模态输入支持,展现全面实力和强大潜力

🌐 Any Model Can Talk 功能扩展了AI应用的可能性

详情链接:https://github.com/gpt-omni/mini-omni

7、Gartner预测:到2027年,40% 的生成式AI解决方案将实现多模态融合

在最近的Gartner IT研讨会上,分析师们分享了一项引人注目的预测:到2027年,40%的生成式人工智能(GenAI)解决方案将实现多模态整合,能够同时处理文本、图像、音频和视频。这一变革将对企业应用产生深远影响。

【AiBase提要:】

🌟 到2027年,40%的生成式人工智能解决方案将实现多模态整合,较2023年大幅提升。

🚀 多模态GenAI和开源大语言模型预计将在未来五年内带来显著的竞争优势。

🔍 特定领域的GenAI模型能提高企业应用的准确性和安全性,鼓励更广泛的采用。

8、报道称特斯拉将获得xAI的AI模型授权 马斯克亲自辟谣!

最近,特斯拉创始人埃隆・马斯克在社交平台上对媒体报道进行了强烈反驳,否认特斯拉与xAI进行收入分享,并指出xAI的模型无法在特斯拉车辆上运行。特斯拉股东对马斯克创办xAI表示不满,已提起诉讼。

image.png

【AiBase提要:】

🌟 马斯克否认特斯拉与xAI进行收入分享,称信息不准确。

🚗 特斯拉与xAI合作不需授权,xAI模型无法在特斯拉车辆上运行。

📈 特斯拉股东对马斯克创办xAI表示不满,已提起诉讼。

9、Getty Images推AI训练样本:3750张高质量照片免费开放

Getty Images推出3750张高质量照片的AI训练数据集,为开发者提供免费访问,旨在支持多种AI应用场景的开发和训练,促进行业的转型与创新。

image.png

【AiBase提要:】

📸 Getty Images推出3750张高质量照片的AI训练数据集,支持多种AI应用场景的开发和训练。

🔍 数据集涵盖15个类别,包括商业、教育、医疗健康等,每张照片附有结构化的元数据,为用户提供安全的训练资源。

🚀 该举措反映了传统图库服务向AI时代的积极转型,为图像识别和生成技术的发展注入新动力。

详情链接:https://github.com/mayuelala/FollowYourCanvas

10、游戏巨头Roblox推全新3D AI工具 实时创建百人开放世界即将成真?

Roblox在最新的开发者大会上展示了其对未来游戏世界的宏伟蓝图,包括革命性AI工具和实时内容创建的愿景。巴兹基的演讲揭示了他们的雄心目标和技术革命,为游戏产业指明了令人兴奋的方向。

【AiBase提要:】

🚀 Roblox目标是每日活跃用户达到十亿,占据全球游戏收入的10%。

💡 Roblox开发的AI工具包括开源的AI 3D基础模型,能通过文本、视频和3D提示生成3D资产。

🌟 Roblox正在努力实现游戏中实时内容创建,将游戏体验提升到一个全新水平。

详情链接:https://www.pcgamer.com/software/platforms/roblox-shows-new-3d-ai-tool-gunning-for-realtime-creation-integrated-with-gameplay/

11、掌上照片魔法师!强大照片编辑器Photoleap

在社交媒体盛行的时代,Photoleap应用正在改变普通用户对照片编辑的认知,让每个人都能轻松创造令人惊艳的视觉作品。然而,如何平衡创意和真实性仍是用户需要思考的问题。

【AiBase提要:】

📸 Photoleap是一款集成多种强大编辑工具的iPhone应用,让用户轻松创造视觉作品。

✨ 核心功能包括背景更换、物体移除和拼贴功能,满足用户创意需求。

🎨 应用提供丰富的滤镜和效果选项,帮助用户表达特定情感或主题。

详情链接:https://top.aibase.com/tool/photoleap

12、AI决策惹众怒:72% 美国人反对,背后原因让人深思!

人工智能技术在决策领域的应用引发了美国民众的强烈反对,尤其在工作面试、银行和租房决策中。调查显示,83%的人希望了解决策所用的数据来源,91%希望能够纠正错误数据。尽管反对声音高涨,部分政府和企业仍在积极推进AI决策技术的应用。

【AiBase提要:】

🌐 大多数美国人反对AI在工作面试、银行和租房决策中的应用。

🤖 83%的人希望了解AI决策所用的数据来源,91%希望能纠正错误数据。

🏛️ 尽管反对声强烈,部分政府和企业仍在积极推进AI决策技术的应用。

13、大乌龙!高盛误判ChatGPT流量下滑引发市场恐慌

这篇文章揭示了高盛分析师彼得・奥本海默发布的报告错误导致市场恐慌的真相。实际上,OpenAI的ChatGPT并未流量下滑,反而呈现强劲增长,活跃用户达到2亿,预计年收入将达35亿至45亿美元。高盛的数据分析失误导致投资者担忧,但实际情况是ChatGPT仍是最受欢迎的AI应用之一。

image.png

【AiBase提要:】

🌟 高盛的报告错误地显示ChatGPT流量下滑,实际数据显示ChatGPT用户同比增长66.2%

📈 OpenAI宣布每周活跃用户达2亿,预计年收入将达35亿至45亿美元,企业业务增长稳步

💼 尽管面临挑战,OpenAI仍然在发展壮大,公司在商业运营方面取得了可观的成绩

举报

  • 相关推荐
  • 大家在看
  • Product Description Generator:利用AI技术生成多语言产品描述

    Product Description Generator是一个基于人工智能技术的电商演示项目,它能够让用户上传产品图片,并生成不同语言的详细产品描述。该项目由Together AI和Llama 3.2 Vision提供支持,使用户能够快速生成适合多语言市场的电商产品描述。它的重要性在于帮助电商企业节省编写产品描述的时间和成本,同时提高产品的国际化水平。

  • Zeli:用中文阅读Hacker News和AI论文

    Zeli是一个旨在帮助用户快速挑选感兴趣的科技新闻文章阅读的平台。它专注于提供Hacker News和AI论文的中文翻译,让用户能够更便捷地获取和理解最新的科技资讯和研究成果。Zeli通过翻译和聚合内容,降低了语言障碍,使得中文用户能够更容易地接触到全球的科技创新和学术进展。

  • DrunkSense:全球首个无需呼吸测醉器的被动醉酒驾驶检测系统

    DrunkSense是VinAI公司推出的一款革命性的醉酒驾驶检测技术,它利用多传感器方法,结合面部表情跟踪、车辆控制监控和空气酒精传感器,能够在无需驾驶员主动配合的情况下,以85%的准确率检测出驾驶员是否处于醉酒状态。这项技术不仅提高了检测的灵敏度,还减少了因醉酒驾驶引发的交通事故,为现代交通安全带来了突破性的改进。DrunkSense技术的出现,为汽车制造商提供了符合严格标准的安全解决方案,有助于提升所有交通参与者的安全感。

  • Intel Core Ultra Desktop Processors:首款AI PC英特尔®酷睿™至尊台式机处理器

    英特尔®酷睿™至尊200系列台式机处理器是首款面向台式机平台的AI PC处理器,为发烧友带来卓越的游戏体验和行业领先的计算性能,同时显著降低功耗。这些处理器拥有多达8个下一代性能核心(P-cores)和多达16个下一代能效核心(E-cores),与上一代相比,在多线程工作负载中性能提升高达14%。这些处理器是首款为发烧友配备神经处理单元(NPU)的台式机处理器,内置Xe GPU,支持最先进的媒体功能。

  • OneIMGAI:一键生成图片的AI工具

    OneIMG是一个基于人工智能技术的在线图片生成工具,它通过用户输入的文本描述来生成相应的图片。这种技术的应用可以极大地提高设计师和创意工作者的工作效率,因为它可以快速地将创意转化为视觉图像。OneIMG的背景信息显示,它是一个创新的产品,旨在通过AI技术简化图片创作流程。目前,OneIMG提供免费试用,但具体的定价策略尚未明确。

  • Silo:多模型对话,文生图

    Silo是一个专注于多模型对话的平台,它通过整合不同的对话模型,为用户提供丰富、深入的交流体验。该平台不仅能够处理文本对话,还能生成图像,为用户提供视觉化的交流方式。Silo的背景信息显示,它是一个创新的尝试,旨在通过技术手段打破传统对话的局限,让交流更加生动和有趣。目前,Silo提供免费试用,具体价格和定位尚未明确。

  • Copilot Lab:探索和体验Microsoft Copilot的智能辅助功能

    Copilot Lab是微软推出的一个在线平台,旨在展示和教育用户如何使用Microsoft Copilot的智能辅助功能。Copilot通过集成到常用的Microsoft 365应用程序中,如Word、Excel、PowerPoint等,帮助用户更高效地完成工作。它利用人工智能技术,根据用户提供的指令(prompts)自动生成内容,从而提高工作效率和创造力。Copilot Lab提供了丰富的示例和指导,帮助用户快速上手并充分利用Copilot的强大功能。

  • We, Robot:特斯拉自动驾驶技术与机器人的未来愿景

    We, Robot 是特斯拉公司展示其在自动驾驶技术和机器人技术领域愿景的页面。它强调了特斯拉对于创建可持续未来、提高交通效率、可负担性和安全性的承诺。该页面介绍了特斯拉的全自动驾驶技术(监督)以及未来自动驾驶汽车和机器人的潜在应用,如Robotaxi、Robovan和Tesla Bot。这些技术旨在通过自动化提高日常生活的便利性,同时减少交通事故,降低交通成本。

  • Kimi探索版:深度推理AI搜索功能,像人类一样思考和解决问题。

    Kimi探索版是Kimi新增的深度推理AI搜索功能,通过理解、拆解问题,再进行搜索和推理给出答案,一次搜索即可精读500个页面。新功能让Kimi能像人类一样思考,提供更准确、实用的搜索结果。还能使用数学模型和编程处理复杂问题,并在必要时进行自我反思以优化答案。简而言之,Kimi探索版让AI搜索更智能,更接近人脑的工作方式。

  • The Innovation Workspace:AI驱动的协作平台,助力团队从想法到成果快速推进。

    The Innovation Workspace 是一个集成了人工智能技术的协作平台,旨在帮助团队更高效地将想法转化为实际成果。它提供了一个无限的画布空间,让团队可以添加内容、推进项目,并共同工作直至想法成真。该平台拥有超过80M用户和250,000家公司,正在使用它来加速和管理他们的端到端创新生命周期。Miro提供了广泛的配置和原生安全控制,以适应不同组织规模和复杂性的具体要求。

  • Inbox AI:AI驱动的个人生产力工具

    Inbox AI是一款AI驱动的个人生产力工具,旨在帮助用户通过智能化的方式管理和自动化电子邮件任务。它提供了基于云的AI服务,同时也支持隐私优先的本地AI处理。用户可以根据自己的需求选择使用在线AI或本地AI,以提高日常工作效率,减少重复性任务,专注于更重要的事情。Inbox AI的主要优点包括无需重复订阅费用、支持多种输入方式(如邮件、屏幕截图、语音命令等)、与多种应用(如Notion、Obsidian等)集成,以及提供Apple Mail扩展等。

  • State of AI Report 2024:2024年AI发展状态的权威报告

    State of AI Report 2024是由AI领域投资者Nathan Benaich和Air Street Capital共同制作的年度报告,旨在分析AI领域最有趣的发展,并引发关于AI现状及其对未来影响的知情讨论。报告涵盖了研究、产业、政治、安全等多个维度,提供了对未来AI发展的预测和评估。这份报告是了解AI领域最新进展和趋势的重要资源,对于研究人员、企业家、政策制定者以及对AI感兴趣的公众都具有极高的参考价值。

  • Cheating LLM Benchmarks:研究项目,探索自动语言模型基准测试中的作弊行为。

    Cheating LLM Benchmarks 是一个研究项目,旨在通过构建所谓的“零模型”(null models)来探索在自动语言模型(LLM)基准测试中的作弊行为。该项目通过实验发现,即使是简单的零模型也能在这些基准测试中取得高胜率,这挑战了现有基准测试的有效性和可靠性。该研究对于理解当前语言模型的局限性和改进基准测试方法具有重要意义。

  • Cove:AI协作者,共同探索、规划和工作的新方式。

    Cove是一个新型的AI协作者,它通过共享工作空间、直接编辑内容、学习用户添加的内容,并提供多个可能的方向来推动用户的工作。Cove利用最新的网络数据,加速用户的工作,同时通过并行搜索提高效率。Cove支持多种文件格式,如文本、表格、图像、网页和PDF等,让AI和用户之间共享上下文,从而更好地协作。Cove的产品背景信息包括由红杉资本领投的600万美元种子轮融资,并且提供Chrome扩展,方便用户在不同的网站和应用中使用。

  • Kvistly:AI驱动的互动式测验制作工具

    Kvistly是一个利用人工智能技术创建互动式测验的平台,旨在提升销售培训、团队建设、培训和入职等环节的效率和参与度。它通过实时的互动学习连接真人,增强团队协作和知识传递。产品背景信息显示,Kvistly在教育和商业培训领域具有重要性,通过游戏化学习提高员工的参与度和学习效果。价格方面,Kvistly提供定价信息,但具体细节需访问其定价页面了解。

  • Quetzal:现代国际化平台,快速实现产品多语言支持。

    Quetzal是一个现代国际化平台,旨在帮助用户快速将产品翻译成多种语言,以获得全球新客户。该平台提供工具,支持20多种语言,与Next.js和React兼容,并且拥有快速设置流程,仅需约10分钟。Quetzal利用人工智能技术,结合应用程序的上下文,在几分钟内实现最佳翻译效果。它还提供了一个仪表板,让用户可以在一个地方查看和管理所有的字符串。产品背景信息显示,Quetzal由Quetzal Labs, Inc.在奥克兰精心打造,并且提供了一个慷慨的免费计划,直到用户添加第二种语言。

  • Aria:多模态原生混合专家模型

    Aria是一个多模态原生混合专家模型,具有强大的多模态、语言和编码任务性能。它在视频和文档理解方面表现出色,支持长达64K的多模态输入,能够在10秒内描述一个256帧的视频。Aria模型的参数量为25.3B,能够在单个A100(80GB)GPU上使用bfloat16精度进行加载。Aria的开发背景是满足对多模态数据理解的需求,特别是在视频和文档处理方面。它是一个开源模型,旨在推动多模态人工智能的发展。

  • Marqo:训练和部署嵌入式模型的AI平台

    Marqo是一个专注于训练和部署嵌入式模型的平台,它提供了一个端到端的解决方案,从模型训练到推理,再到存储。Marqo支持150多种嵌入式模型,并且可以快速原型设计,加速迭代,并无缝部署。该平台支持多模态模型,如CLIP,可以从图像和其他数据类型中提取语义信息,实现文本和图像的无缝搜索,甚至可以将文本和图像组合成一个向量。Marqo还支持100多种语言的搜索,提供最先进的多语言模型,无需手动进行语言配置即可扩展到新的地区。此外,Marqo的可扩展性允许用户在笔记本电脑上的Docker镜像中运行,也可以扩展到云端数十个GPU推理节点,提供低延迟的搜索服务。

  • AMD Instinct MI325X Accelerators:为AI基础设施提供领导性的AI性能

    AMD Instinct MI325X加速器基于AMD CDNA 3架构,专为AI任务设计,包括基础模型训练、微调和推理,提供卓越的性能和效率。这些产品使AMD的客户和合作伙伴能够在系统、机架和数据中心层面创建高性能和优化的AI解决方案。AMD Instinct MI325X加速器提供了行业领先的内存容量和带宽,支持6.0TB/s的256GB HBM3E,比H200多1.8倍的容量和1.3倍的带宽,提供了更高的FP16和FP8计算性能。

  • Ryzen™ AI PRO 300 Series Processors:第三代商用AI移动处理器,为商务用户带来前所未有的AI计算能力和多日电池续航。

    AMD Ryzen™ AI PRO 300系列处理器是专为企业用户设计的第三代商用AI移动处理器。它们通过集成的NPU提供高达50+ TOPS的AI处理能力,是市场上同类产品中性能最强的。这些处理器不仅能够处理日常的工作任务,还特别为满足商务环境中对AI计算能力的需求而设计,如实时字幕、语言翻译和高级AI图像生成等。它们基于4nm工艺制造,并采用创新的电源管理技术,能够提供理想的电池续航能力,非常适合需要在移动状态下保持高性能和生产力的商务人士。

今日大家都在搜的词:

热文

  • 3 天
  • 7天