首页 > 业界 > 关键词  > Civitai最新资讯  > 正文

AI视野:Civitai上线模型训练功能;文心大模型用户规模达4500万;OpenAI开发高准确度AI检测工具;富士康与英伟达宣布合作建设“AI工厂”

2023-10-18 15:05 · 稿源:站长之家

文头.jpg

🤖📈💻💡大模型动态

文心大模型用户规模达4500万

在昨天的百度世界2023大会上,文心大模型4.0正式发布,开启邀请测试。据官方介绍,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。

【AiBase提要】

1. 文心大模型4.0在9月已开始小流量上线。

2. 文心大模型4.0在百度世界2023大会上正式发布。

3. 用户规模已达4500万,开发者5.4万,插件超过500个。

SD模型交流网站Civitai上线模型训练功能

Civitai最近上线了Lora模型在线训练功能和货币化系统,让用户能够打赏模型作者并支付货币进行在线模型训练。

image.png

[AiBase提要]

1️⃣ Civitai推出Lora模型在线训练和货币化系统,用户可打赏作者并支付货币进行训练。

2️⃣ 国内的liblib.ai也提供类似功能,Civitai的训练效果更好,但liblib.ai速度较快。

3️⃣ Civitai提供详细教程,两网站支持图片上传和打标,liblib.ai速度更快。

Civitai打标详细教程地址:

https://www.reddit.com/r/StableDiffusion/comments/118spz6/captioning_datasets_for_training_purposes/

模型体验地址:

Civitai:https://civitai.com/models/164865/runstyle

liblib:https://www.liblib.ai/modelinfo/6d99669755e04bdfa37891102f31a60d?mine=1

📰🤖📢AI新鲜事

「奶奶漏洞」再次曝光:ChatGPT、Bing全被骗了

通过巧妙修改图片上下文,「奶奶漏洞」成功欺骗ChatGPT、Bing机器人,绕过验证码,引发AI模型漏洞。

image.png

【AiBase提要】:

🕵️「奶奶漏洞」重现:Bing机器人被PS奶奶遗物欺骗,绕过验证码。

🤖 AI模型漏洞分析:改变上下文可绕过模型规则,造成可视化越狱。

🔒 漏洞未得到Bing的正式评论,揭示AI模型的潜在安全风险。

百度智能云发布国内首个AI原生应用商店

在百度世界2023大会上,百度智能云发布了国内首个AI原生应用商店“千帆AI原生应用商店”,旨在便捷、可靠地连接AI原生应用供需,提高客户应用选型与采购效率。

【AiBase提要:】

- 🚀 百度智能云发布国内首个AI原生应用商店,面向企业客户,旨在提高应用选型与采购效率。

- 💻 企业用户可以在千帆AI原生应用商店选择和购买AI原生应用。

- 🌐 百度智能云建立了全链路生态支持体系,包括千帆社区、AI原生应用孵化、销售商机、市场营销、赋能培训以及千帆AI原生应用商店。

富士康与英伟达宣布合作建设“AI工厂”

今天在鸿海科技日活动中,英伟达首席执行官黄仁勋和鸿海集团董事长刘扬伟宣布合作建立人工智能工厂,加速AI驱动的电动车和机器人平台的开发。

【AiBase提要】:

🤖 英伟达和富士康宣布合作建立人工智能工厂,加速AI驱动的电动车和机器人平台的开发。

🏭 鸿海计划开发名为「AI 工厂」的新型数据中心,支持数字和生成式AI服务的制造。

💻 这些系统将基于英伟达的硬件和软件,供应给客户内部部署加速计算,用于支持内部AI工作负载和自主机器人、自动驾驶汽车训练。

OpenAI开发高准确度AI检测工具

OpenAI最近宣布正在研发一种工具,旨在高度准确地检测由人工智能生成的图像。该工具的可靠性高达99%,由OpenAI的首席技术官Mira Murati确认。

【AiBase提要】:

🤖 OpenAI研发工具,99%可靠性,用于检测AI生成图像,有望防止虚假新闻报道。

💼 首席技术官Mira Murati确认工具在内部测试,计划未来发布,增强了人工智能的前景。

🌐 OpenAI还计划在GPT-4之后推出新的人工智能模型,展示持续创新的决心。

金山办公与科大讯飞在AI大模型等方面展开深度合作

金山办公与科大讯飞宣布战略合作,加强合作,共同推动数字办公、AI大模型等领域的创新。

AiBase提要:

🤝 金山办公与科大讯飞宣布战略合作,继续发挥各自技术优势,深度合作在数字办公产品、AI大模型等领域。

🏢 金山办公将整合WPS365等一站式智能办公平台与科大讯飞的行业解决方案,拓展数字化合作路径,提升用户体验。

📚 合作已经在终端部署、语音能力、教育服务等领域取得成功,推动超35万教研用户使用科大讯飞AI教研平台备课和研修。

谷歌在AI版权官司中捍卫“学习不等于窃取”

谷歌坚决反驳一项集体诉讼,声称使用公开信息来训练AI不侵犯隐私和财产权,这或将对AI数据使用的未来产生深远影响。

【AiBase提要:】

🔍 谷歌强烈捍卫使用公开数据训练AI的合法性,反对指控侵犯隐私和财产权。

📚 谷歌总法律顾问坚称该诉讼“毫无根据”,美国法律支持公共信息用于新有益用途。

🤖 本官司结果可能对AI行业和数据使用施加更严格的法律限制,对AI创新带来负面影响。

三星将开发高密度芯片以满足人工智能需求

三星电子的存储芯片业务总裁Lee Jung-bae宣布他们将提升DRAM和NAND闪存存储芯片的密度,强调了新材料的关键性,以满足不断增长的人工智能需求。

【AiBase提要:】

📈 三星计划提高DRAM和NAND存储芯片的密度,采用新材料,以满足不断增长的需求。

🧠 公司专注于满足人工智能芯片的需求,包括生产高性能HBM3芯片和定制的HBM芯片。

💡 三星将不断发展存储芯片产品线,以适应多样化需求和长周期的交付。

沃尔玛宣布负责任的 AI 承诺

沃尔玛发布新闻稿,承诺负责任使用人工智能,强调透明度、安全性、隐私、公平性、责任和以顾客为中心。

【AiBase提要:】

🌐 沃尔玛宣布负责任的 AI 承诺,强调透明度,承诺帮助顾客、会员和员工了解数据和技术的使用方式。

🔒 安全性是其中一项核心要点,沃尔玛将采用先进的安全措施来保护用户数据。

🤝 沃尔玛承诺负责任地使用人工智能,评估偏见,以确保技术有助于提供更好的服务。

联发科与vivo OriginOS合作 AI大语言模型在手机端侧落地

联发科宣布与vivo OriginOS深度合作,在手机端侧实现了10亿和70亿AI大语言模型,以及10亿AI视觉大模型的落地

【AiBase提要】

📌联发科与vivo OriginOS深度合作,70亿AI大语言模型在手机端侧落地。

📱 MediaTek的AI处理器与NeuroPilot开发平台提供强大的AI算力。

🚀 vivo自研AI大模型将在OriginOS4系统首次应用,具备不同参数量级的大模型,全面覆盖核心应用场景。

纽约市长因使用AI多语电话推广引争议

纽约市市长亚当斯使用AI向市民发送多语电话推广,却引发伦理争议,因他声称能说多种语言,实际却不懂。

【AiBase提要:】

🤖 市长亚当斯使用AI工具发送多语电话推广活动。

🗣️ 他声称能说这些语言,但实际不懂,引发伦理争议。

📞 电话主要用于招聘和音乐会宣传,未告知市民是AI生成的声音。

🤖📱💼AI应用

百度大模型智能编程助手Comate将在10月24日全面开放

百度将于10月24日全面开放Comate智能编程助手,这一自研的AI应用已在内部广泛使用,为工程师提供优质代码生成和编码支持。

微信截图_20231018110129.png

【AiBase提要】

📌 百度自研的AI应用Comate智能编程助手将于10月24日全面开放,覆盖80%以上的工程师,提供优质代码生成支持。

📌 Comate是基于文心大模型开发的智能编码助手,结合多年编程数据和优秀开源数据,提高编码效率。

📌 它提供多种功能,包括代码解释、技术问答、实时续写,不仅支持常用IDE,还自动化用例生成。

Firefox引入AI检测工具Fakespot 可识别虚假评论

Mozilla的Firefox将整合Fakespot,一款专门设计用于检测虚假在线评论的工具,以帮助消费者辨别真实和虚假评论,提高在线购物的可信度。

【AiBase提要】

🔍 Mozilla的Firefox整合Fakespot工具,解决购物中虚假评论问题。

🌐 Fakespot利用AI分析多个数据点,评估评论真实性。

📆 该功能计划在11月首先在亚马逊、百思买和沃尔玛上推出。

开源AI日历调度系统Cal.ai 可自动安排会议和事件

Cal.ai是一款强大的AI日程助手,能够自动预订和管理会议,查询实时人员可用性,提供会议重排建议,使日程管理更高效智能。

image.png

地址:https://cal.com/ai

【AiBase提要】:

📅 Cal.ai是一款AI日程助手,可自动预订和管理会议。

🕒 它提供实时人员可用性查询,帮助找到最适合的会议时间。

🚀 Cal.ai的使命是将日程管理带入下一代,提供前所未有的便捷和智能化体验。

👨‍💻💡🎯聚焦开发者

MQ-Det多模态大模型NeurIPS2023首亮相

MQ-Det是一款革命性的多模态开放世界检测大模型,在NeurIPS2023首次亮相,引起广泛关注。该模型的核心创新在于融合了文本描述和视觉示例查询,以显著提升目标检测的精确率,整体性能提高了7.8%。

image.png

论文链接:https://arxiv.org/abs/2305.18980

代码地址:https://github.com/YifanXu74/MQ-Det

AiBase提要:

🚀 MQ-Det是首个多模态开放世界检测大模型,通过融合文本描述和视觉示例查询,提升了目标检测精确率7.8%。

🔍 该模型设计包括门控感知模块和视觉为条件的掩码语言预测训练策略,具备多模态查询能力。,

💡 实验结果显示,MQ-Det在LVIS基准数据集上取得显著的性能提升,支持finetuning-free和小样本检测,展现了多模态查询目标检测的潜力。

DeepMind新机器学习模型UniSim:模拟现实以训练机器人和游戏角色

谷歌DeepMind与多所大学合作开发UniSim机器学习模型,用于创建真实模拟环境,培训人工智能系统,填补模拟与现实之间的差距。

image.png

【AiBase提要】

🔍 UniSim是一通用互动模拟器,可模拟真实世界互动,用于机器人和游戏角色培训。

🔍 它模仿高级指令和低级控制,提供真实世界数据的训练示例,数据源广泛。

🔍 UniSim集成强化学习环境,模拟各种结果,广泛应用于游戏、电影、虚拟实体培训等。

斯坦福博士推加速推理新方法Flash-Decoding

FlashAttention团队最新推出Flash-Decoding方法,通过并行操作提高大型Transformer架构的推理速度,特别适用于处理长上下文LLM模型,提速8倍。

【AiBase提要:】

🚀 Flash-Decoding方法旨在提高大型Transformer架构的推理速度,尤其对长上下文LLM模型非常有效。

🔄 该方法通过并行操作加载Key和Value缓存,重新缩放和合并结果,显著提高推理速度。

🚀这个方法在CodeLLaMa-34b上进行了基准测试,结果显示Flash-Decoding可以将长序列解码速度提高8倍,同时具有更好的扩展性。

MemGPT:允许开发者创建永久聊天机器人

MemGPT是一创新语言模型,通过内存管理系统,能处理长对话和文档分析任务,同时支持个性化回应,提高对话连贯性和准确性。

AiBase提要:

🧠 MemGPT是一新型语言模型,引入内存管理系统,处理长对话和文档分析任务。

🤖 MemGPT支持创建永久聊天机器人,管理记忆,提供扩展上下文,实现永久对话。

🎯 除了对话,MemGPT在文档分析任务中表现出色,提供准确答案和键值检索。不受上下文长度限制。

Pytorch发布移动解决方案ExecuTorch 支持移动设备AI部署

PyTorch发布ExecuTorch,支持移动设备AI部署,以及PyTorch2.1更新,将NumPy代码编译为C++/CUDA,速度提升35倍。

【AiBase提要:】

🚀 PyTorch发布ExecuTorch,支持移动设备AI部署,提供高性能、便携性和生产力。

📊 PyTorch2.1更新引入torch.compile,将NumPy代码编译为C++/CUDA,速度提升35倍。

📢 在新版本PyTorch2.1中,Python代码执行效率提高,虽然Python占比较高,但速度显著提升。

举报

  • 相关推荐
  • 大家在看
  • Nabubit:数据库设计助手,简化数据库设计、管理和演化。

    Nabubit是一个旨在帮助用户优化数据库设计、管理和演化的在线工具。它提供了上传数据库架构图、可视化数据库结构、以及使用自然语言提问的功能。用户可以从头开始设计数据库,无需担心命名或记住语法。完成设计后,可以将其导出到自己喜爱的数据库或框架中。

  • Otter Script:文档生成平台,快速创建复杂文档。

    Otter Script是一个文档生成平台,它通过自动化技术帮助用户节省时间,将原本需要几天完成的复杂文档工作缩短到几分钟。它简化了工作流程,让用户可以更高效地完成更多任务。

  • BNA:多功能AI超级应用,涵盖社交、电商、娱乐和教育。

    BNA AI Super App是一款集成了多种智能服务的超级应用,它不仅提供社交功能,如分享帖子、写博客、聊天和视频通话,还涵盖了AI电商和娱乐服务。此外,该应用还提供40种语言的AI教学服务,帮助用户学习不同的语言。BNA AI Super App以其强大的AI功能和多语言支持,满足了不同用户群体的需求。

  • Elisi:高效能自主层级式计划助手

    Elisi 是一款旨在帮助用户实现个人成长的终极组织者和指南。它通过直观的设计和用户友好的说明,帮助用户将梦想转化为清晰的结果,分解成可实现的里程碑,并通过AI技术理解并适应用户的个人需求,确保每一天都更有条理和高效。Elisi 致力于提供便捷服务,主要功能套件完全免费。

  • Omi AI:个性化AI助手,记录每一刻,与AI对话获取反馈。

    OMI APP是一个任务驱动的个性化AI助手,旨在通过语音和音频转录功能帮助用户提高记忆力和沟通效率。它是一个开源的AI记事本,提供提醒、建议等功能,同时注重用户隐私。

  • MeowMail:高送达率的AI电子邮件营销工具

    MeowMail是一款集成在Shopify后台的电子邮件营销应用,利用AI技术自动选择最佳发送时间,提高邮件的送达率至98%以上。它支持拖放编辑、从Klaviyo导入邮件列表、使用Beefree编辑器创建新邮件,并通过设定支出限制来管理邮件营销活动。MeowMail还提供企业级支持和自动翻译文本功能,帮助商家以低成本实现高效的邮件营销。

  • Maia 100:微软定制AI加速器,专为大规模AI工作负载设计。

    Maia 100是微软为Azure设计的首款定制AI加速器,专为大规模AI工作负载而打造,通过软硬件的协同优化,实现了性能、可扩展性和灵活性的最大化。它采用了TSMC N5工艺和COWOS-S互连技术,具备高达1.8TB/s的带宽和64GB的容量,支持高达700W的热设计功耗(TDP),但以500W运行,确保了高效的能效比。Maia 100集成了高速张量单元、向量处理器、DMA引擎和硬件信号量,支持多种数据类型和张量切分方案,并通过以太网互连支持大规模AI模型。此外,Maia SDK提供了丰富的组件,支持快速部署PyTorch和Triton模型,并通过双编程模型确保高效的数据处理和同步。

  • LTM:超长上下文模型,革新软件开发

    Magic团队开发的超长上下文模型(LTM)能够处理高达100M tokens的上下文信息,这在AI领域是一个重大突破。该技术主要针对软件开发领域,通过在推理过程中提供大量代码、文档和库的上下文,极大地提升了代码合成的质量和效率。与传统的循环神经网络和状态空间模型相比,LTM模型在存储和检索大量信息方面具有明显优势,能够构建更复杂的逻辑电路。此外,Magic团队还与Google Cloud合作,利用NVIDIA GB200 NVL72构建下一代AI超级计算机,进一步推动模型的推理和训练效率。

  • EZ-work AI文档翻译:智能AI翻译,高效文档语言转换助手。

    EZ-work AI文档翻译是一款专注于文档翻译的在线服务,支持多种语言的翻译,包括中文、英语、日语、俄语、阿拉伯语和西班牙语等。它使用先进的AI技术,如gpt-4o-mini和deepseek-chat模型,为用户提供快速、准确的翻译服务。该产品适用于需要文档翻译的个人和企业,尤其在国际交流和学术研究领域尤为重要。

  • Watson AI:会议助手,自动记录并总结会议要点。

    Watson AI是一款会议助手应用程序,它通过录制系统音频和麦克风来转录和总结会议内容,自动提取行动项和会议摘要,帮助用户更高效地进行会议记录和回顾。

  • PicTech AI: 免费在线AI图片翻译 助力跨境电商

    PicTech AI是由学以致用科技旗下的智能图像工具品牌,专注于为跨境电商提供AI驱动的图片翻译服务。该产品利用人工智能技术,实现高准确率和高清晰度的图片翻译,支持中文、英语到日语、韩语等多国语言的翻译。PicTech AI的智能抠图功能,能够准确检测图片主体边缘,一键去除背景,无需专业编辑。产品背景信息显示,其团队由来自百度、网易、阿里巴巴等行业巨头的顶尖高科技人才组成,具备强大的技术实力和产品能力。该产品定位于帮助跨境电商从业者简化工作流程,提高效率,无需懂外语或图像处理技能即可使用。

  • AnythingLLM:一站式AI应用,支持多种文档和模型。

    AnythingLLM是一个多功能的桌面客户端,支持多种语言模型(LLM)和文档类型,提供完全私密的使用体验。用户可以根据自己的需求选择企业级模型、自定义模型或开源模型,如GPT-4、Llama、Mistral等。产品支持一键安装,本地运行,无需互联网连接,保护用户隐私。

  • 林哥的大模型野榜:更适合中国宝宝体质的大模型产品排行榜

    林哥的大模型野榜是一个专注于中国用户需求的大模型产品排行榜,提供了多维度的评估和排名,帮助用户更好地了解和选择适合的大模型产品。

  • Fluximg.com:AI文本到图像生成器,支持多尺寸和自动翻译。

    Fluximg.com是一个基于Flux模型的AI图像生成网站,提供从文本到图像的转换服务。它支持多种语言,包括中文和英文,并且具有用户友好的界面。网站提供免费和专业版本,使用户能够根据自己的需求选择不同的服务级别。

  • 现代文转古文:将现代汉语转化为古汉语,提升文采。

    现代文转古文是一款能够将现代汉语自动转换为古汉语的模型,它通过先进的自然语言处理技术,使得用户可以轻松地将现代文本转换成具有古典韵味的古文。这种转换不仅能够增加文本的文学价值,还能在教育、文学创作、文化传承等方面发挥重要作用。

  • Zamba2-mini:先进的小型语言模型,专为设备端应用设计。

    Zamba2-mini是由Zyphra Technologies Inc.发布的小型语言模型,专为设备端应用设计。它在保持极小的内存占用(<700MB)的同时,实现了与更大模型相媲美的评估分数和性能。该模型采用了4bit量化技术,具有7倍参数下降的同时保持相同性能的特点。Zamba2-mini在推理效率上表现出色,与Phi3-3.8B等更大模型相比,具有更快的首令牌生成时间、更低的内存开销和更低的生成延迟。此外,该模型的权重已开源发布(Apache 2.0),允许研究人员、开发者和公司利用其能力,推动高效基础模型的边界。

  • InterTrack:无需对象模板的人体与物体交互跟踪技术

    InterTrack 是一种先进的跟踪技术,能够在单目RGB视频中跟踪人体与物体的交互,即使在遮挡和动态运动下也能保持跟踪的连贯性。该技术无需使用任何对象模板,仅通过合成数据训练即可在真实世界视频中实现良好的泛化。InterTrack 通过分解4D跟踪问题为每帧的姿态跟踪和规范形状优化,显著提高了跟踪的准确性和效率。

  • GenWarp:生成新视角的图像,保持语义信息。

    GenWarp是一个用于从单张图像生成新视角图像的模型,它通过语义保持的生成变形框架,使文本到图像的生成模型能够学习在哪里变形和在哪里生成。该模型通过增强交叉视角注意力与自注意力来解决现有方法的局限性,通过条件化生成模型在源视图图像上,并纳入几何变形信号,提高了在不同领域场景下的性能。

  • Qwen2-VL:新一代视觉语言模型,更清晰地看世界。

    Qwen2-VL是一款基于Qwen2打造的最新一代视觉语言模型,具备多语言支持和强大的视觉理解能力,能够处理不同分辨率和长宽比的图片,理解长视频,并可集成到手机、机器人等设备中进行自动操作。它在多个视觉理解基准测试中取得全球领先的表现,尤其在文档理解方面有明显优势。

  • Dressplay:个性化服装生成器,轻松变换你的装扮。

    Dressplay是一个创新的在线服装生成器,允许用户通过简单的步骤生成个性化的服装。它利用先进的图像处理技术,让用户能够选择服装区域、目标人物以及想要穿戴的服装,从而创造出逼真的服装效果。Dressplay背后的技术不仅提高了服装设计的效率,也为用户提供了一种全新的个性化体验。目前,Dressplay提供免费试用,用户可以通过网页访问并体验其功能。

今日大家都在搜的词: