首页 > 业界 > 关键词  > gpt4最新资讯  > 正文

AI视野:百度希壤与高通达成合作;gpt4对手claude pro上线;快手内测AI文生图功能;Vercel发布界面生成器v0.dev

2023-09-15 15:04 · 稿源:站长之家

🤖📱💼AI应用

gpt4迎来最强对手,claude pro 正式上线

Anthropic 推出面向消费者的高级订阅计划 Claude Pro,该计划每月收费20美元,相比于免费版 Claude2,拥有更多的使用量、早期访问新功能的权限和更强大的上下文处理能力。然而,与 ChatGPT Plus 相比,Claude Pro 在信息准确性方面稍逊一筹。

image.png

要点:

1、Anthropic 推出面向消费者的高级订阅计划 Claude Pro。

2、Claude Pro 每月收费20美元,具有比免费版更多的使用量和早期访问新功能的权限。

3、Claude Pro 相较于 ChatGPT Plus 在上下文处理能力方面具有优势,但在信息准确性方面稍逊一筹。

Vercel发布界面生成器v0.dev 简单文本描述即可快速生成界面

Vercel推出了界面生成器v0.dev的测试版本,用户可以通过自然语言描述来生成界面代码。该工具可以大大简化界面设计流程,降低设计成本。

1.jpg

地址:https://v0.dev/

要点:

Vercel发布的v0版本界面生成器,可以通过文本描述生成界面代码。

生成的代码可预览、调整和部署,简化界面设计工作量。

该应用处于内测阶段,具有广阔的应用前景和发展潜力。

快手内测AI文生图功能 “快手AI玩评”

快手正在其短视频评论区内测AI文生图功能“快手AI玩评”。用户可以通过输入文字,一键生成多种风格的图片。这基于快手自主研发的大模型“快意”,它在多个大模型榜单上表现出色。此外,快手的“快手AI对话”功能也已在安卓版APP开放内测,可帮助用户快速获取信息。

要点:

1. 快手在短视频评论区内测AI文生图功能“快手AI玩评”,用户可一键生成图片。

2. 该功能基于快手自主研发的大模型“快意”,在多个榜单上表现出色。

3. “快手AI对话”功能已在安卓版APP开放内测,可快速获取信息。

Contra Pro:专为独立开发者和设计师服务的AI作品集建站平台

Contra Pro是面向自由职业者的专业在线作品集平台,提供强大的数据分析工具、模板、域名定制等功能,助力获取客户、建立品牌影响力。

image.png

体验地址:https://contra.com/pro

要点:

1、数据分析 功能全面追踪作品传播效果

2、模板和域名 可定制个性化专属品牌

3、多平台支持 实现作品多平台同步发布

Perplexity发布Collections功能 可将搜索结果保存为不同主题的合集

Perplexity推出Collections功能,用户可以将搜索结果保存为不同主题的合集,便于协同组织和管理知识。

1.jpg

体验地址:https://www.perplexity.ai/library

要点:

1. Collections功能可以将搜索结果按主题组织成合集,用于笔记整理或内容展示。

2. 用户可以邀请他人协作共同编辑一个Collection,丰富主题信息。

3. Collections功能提供了高效的知识组织和共享平台,有利于协同构建知识图谱。

Metaverse踏出VR 元宇宙平台Horizon Worlds网页版已上线

元宇宙平台Horizon Worlds推出网页版和移动App版本公测,标志着其有望吸引更多非VR设备用户,为其未来增长提供动力。

VR 元宇宙 增强现实

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1、Horizon Worlds网页版和移动App版本面向部分用户开放公测。

2、公测版允许用户通过手机或网页浏览虚拟世界、使用虚拟形象。

3、移动端和网页版加入有望为Horizon Worlds带来更广阔的用户群,实现爆发式增长。

👨‍💻💡🎯聚焦开发者

PostgreSQL16发布 提高包括AI在内的工作负载性能

PostgreSQL16最新版本发布,提供性能提升、大规模数据复制支持,以及安全性改进和SQL/JSON标准兼容性增强。

image.png

地址:https://www.postgresql.org/docs/16/release-16.html

要点:

1、性能提升:支持批量加载,查询并发改进,扩展并行查询选项等

2、数据复制:增强逻辑复制,支持从备用节点设置,提高回放速度

3、安全增强:细化角色权限控制,提供更高的数据安全性

研究人员利用AI从文字生成3D头像 实现虚拟试衣和形状编辑

近日,研究人员公布了两项利用人工智能从文字生成三维头像的新研究成果,实现了虚拟试衣和头像形状编辑等应用。这些成果来自德国马普所等机构的研究人员,发表在 arXiv 上。

QQ截图20230915100910.jpg

要点:

1、德国马普所等机构的研究人员利用 AI 技术实现了从文字生成3D 头像的新方法。

2、利用该方法可以实现虚拟试衣和头像形状编辑等应用。

3、这些研究成果对时装电商、社交平台和元宇宙等领域将产生深远影响。

instaflow:利用校正流技术加快将文本转化为图像的过程

InstaFlow是一个快速、一步生成高质量图像的模型,通过利用直线概率流和迁移学习,以接近Stable Diffusion的图像质量显著减少计算资源需求。

image.png

项目地址:https://github.com/gnobitab/instaflow

要点:

1. InstaFlow使用文本调整的反流整流生成直线概率流,避免了弥散模型的多步采样,极大提升了推理速度。

2. InstaFlow生成质量接近Stable Diffusion,在MS COCO数据集上的FID指标与最先进的GAN模型相当。

3. InstaFlow只需要有监督训练,通过从预训练好的Stable Diffusion模型迁移学习,训练过程简单高效。

exllamav2:一个用于在现代消费 GPU 上运行本地 LLM 的推理库

exllamav2是一个用于在现代消费级GPU上本地运行大型语言模型的快速推理库,能够利用最新GPU技术,以非常快的速度对巨大神经网络进行推理,在不牺牲太多质量的情况下,实现在普通台式机上运行大模型。

image.png

项目地址:https://github.com/turboderp/exllamav2

要点:

1. 支持新的可调量化格式EXL2,混合使用2-8比特量化,提升性能。

2. 优化的代码架构获得1.5-2倍的推理加速。

3. 易于安装使用,提供交互式示例,支持模型转换,降低使用门槛。

UMMAFormer:一种有效识别视频中的伪造内容的Transformer框架

UMMAFormer是一种新型Transformer框架,通过时序特征异常注意力模块和并行交叉注意力特征金字塔网络,实现了视频内容伪造的有效识别,在多个数据集上超越已有方法。

image.png

论文地址:https://arxiv.org/pdf/2308.14395v1.pdf

要点:

1. 提出时序特征异常注意力模块增强对篡改的检测。

2. 设计并行交叉注意力特征金字塔网络进行特征增强。

3. 在视频修复场景提出新的TVIL数据集,在多个数据集上表现优异。

📰🤖📢AI新鲜事

百度希壤与高通在AI等领域达成合作

百度与高通达成战略合作,将在XR技术、生成式AI、数字人等领域开展深度合作。

人机合作

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. 百度与高通在北京签署战略合作谅解备忘录,将在XR领域展开合作。

2. 双方将在XR技术、生成式AI、数字人等领域开展技术、市场与生态合作。

3.百度将整合高通的XR开发者平台,利用自身技术优势,共同探索文旅、教育等行业的商业解决方案。

王小川成立上海百川智能公司

王小川在上海成立百川智能公司,注册资本500万元,主要从事人工智能软件开发和服务。

百川大模型,百川智能

要点:

1. 百川智能由王小川和茹立云分别持股99%和1%。

2. 公司注册资本500万元,王小川为法定代表人和执行董事。

3. 公司经营范围包括人工智能应用软件开发、人工智能双创服务等。

人工智能芯片设计公司 Arm 上市股价飙升25%

人工智能芯片设计公司Arm在纳斯达克成功上市,首日收盘价较发行价高出25%,成为近两年来最大规模的IPO。Arm的芯片设计和指令被广泛应用于智能手机、笔记本电脑等电子设备。

要点:

1. Arm在纳斯达克上市,首日股价较发行价高出25%,市值约650亿美元。

2. Arm为苹果、三星、英伟达等知名公司提供芯片设计和指令。

3. Arm的技术广泛应用于智能手机、笔记本电脑等电子设备。

马斯克、小扎等AI大佬密会探讨AI监管

9月14日,舒默参议员在华盛顿主持召开了AI闭门峰会。与会嘉宾包括马斯克、小扎、谷歌CEO等AI领域大佬。马斯克认为此会议可能成为文明历史重要时刻。与会者就AI如何改变世界进行了预测,内容涉及治愈癌症、改善食品供应、教育等。同时,也提出AI存在偏见和导致失业的潜在风险。

image.png

图片来自wired

要点:

1. 舒默参议员主持召开AI闭门峰会,汇集AI领域大佬。

2. 与会者就AI如何改变生活进行预测,呼吁政府参与AI监管。

3. 马斯克和小扎支持政府监管AI,但也关注创新。

Adobe财报符合预期 AI收入增长有限股价微跌

Adobe第三季度财报销售额符合分析师预期,达到48.9亿美元,同比增长10%。但人工智能收入增长有限,未达到投资者预期。Adobe近期提高了AI产品定价,存在一定风险。展望第四季度,Adobe预测销售额介于49.8亿至50.3亿美元,利润率也符合预期。

Adobe Firefly,萤火虫,生成式AI,人工智能,图片生成

要点:

1) Adobe第三季度销售额符合预期,同比增长10%。

2) 人工智能收入增长有限,未达投资者预期。

3) 四季度销售额预测符合预期,但AI定价策略面临不确定性。

美国国税局启动人工智能计划追缴百万富翁逃税账单

美国国税局宣布启动使用人工智能技术的计划,旨在加强对富翁逃税行为的监管。该计划主要针对年收入超过100万美元的富人纳税人和大型公司法人,利用先进技术加强税收监管,警示富翁纳税人逃税不再容易。

AI机器人教父

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1、美国国税局计划运用人工智能技术加强对富翁逃税行为的监管

2、计划主要针对年收入超过100万美元的富人纳税人和大型公司法人

3、该计划利用先进技术加强税收监管,警示富翁纳税人逃税不再容易

谷歌即将发布对话式人工智能软件Gemini

谷歌即将发布对话式人工智能软件Gemini,定位于与OpenAI的GPT-4竞争,Gemini由一系列大型语言模型组成,可支持聊天机器人、文本生成等多种应用,是谷歌在生成式AI领域追赶OpenAI的重要举措。

中国AI机器人

图源备注:图片由AI生成,图片授权服务商Midjourney

要点:

1. 谷歌将发布对话AI软件Gemini,定位与OpenAI的GPT-4竞争

2. Gemini由多个大型语言模型组成,可支持多种文本生成应用

3. Gemini是谷歌在生成式AI领域追赶OpenAI的重要布局

MLPerf放榜!AI芯片公司墨芯人工智能再夺MLPerf大模型推理三项冠军

最新MLPerf推理测试结果公布,墨芯人工智能的S30计算卡在GPT-J大模型的单卡、4卡、8卡推理性能均获得第一。通过双稀疏算法与硬件协同设计,墨芯在GPT-J模型上取得1.8倍于英伟达H100的性能优势。这证明了稀疏计算是大模型时代的关键,可减少模型计算量,解决大模型推理的算力瓶颈。

image.png

要点:

1. MLPerf公布GPT大模型推理测试,墨芯S30卡单卡、4卡、8卡均获第一

2. 墨芯双稀疏算法硬件协同,在GPT-J上性能领先英伟达H1001.8倍

3. 稀疏计算减少模型计算,可解决大模型推理算力瓶颈

沃顿商学院:ChatGPT的创意能力,比MBA学生更好

沃顿商学院进行了一项关于ChatGPT创意能力的研究,结果显示ChatGPT在创意测试中表现超过了MBA学生。

图片

研究地址:https://knowledge.wharton.upenn.edu/article/is-chatgpt-a-better-entrepreneur-than-most/

要点:

1. 沃顿商学院让ChatGPT和MBA学生在15分钟内为大学生市场设计200个创意产品,结果ChatGPT表现更好。

2. ChatGPT生成的200个创意想法的平均购买率为46.8%,高于学生的40.4%。

3. 在前10%的顶级创意中,87.5%来自ChatGPT,可见其在创意测试中整体优于人类。

🤖📈💻💡大模型动态

全面取代Llama2!Baichuan2自曝史上最全训练细节

最近,百川智能宣布开源两款大模型Baichuan2-7B和Baichuan2-13B,在多个中文、英文通用基准测试中表现最优,明显优于Meta研发的Llama2。Baichuan2使用高达2.6TB的多领域训练数据,实现了高效、稳定、可预测的训练过程。此外,百川智能还开源了11个中间检查点,这对模型的继续研究具有重要价值。值得一提的是,Baichuan2系列模型均可免费商用,这对国内企业来说是一个绝佳的选择。

图片

下载链接:https://github.com/baichuan-inc/Baichuan2

要点:

1. Baichuan2在多个中文、英文通用基准测试中效果最好,明显超过Llama2

2.Baichuan2训练数据高达2.6TB,覆盖科技、商业等多个领域 ,实现了高效、稳定、可预测的训练过程

3. 百川开源了11个中间检查点,对模型研究很有价值

举报

  • 相关推荐
  • 大家在看
  • Ideogram 1.0:人工智能辅助创意生成图片

    Ideogram 1.0是一个文本转图像的生成模型,能够根据文本描述生成高保真的图像。它拥有前沿的文本渲染能力,无与伦比的照片实感和提示符合度,以及名为“魔法提示”的新功能,可以帮助用户为美丽的创意图像编写详细的提示。Ideogram 1.0现已面向所有ideogram.ai的用户开放!您可以在ideogram.ai免费注册,加入我们的全球创作者社区,结识新朋友、分享您的图像和提示、从同行的创造力中汲取灵感。除了每日免费生成量外,我们还推出了付费订阅计划,提供优先生成、私人生成、图像上传和Ideogram编辑器访问等功能。

  • Playground v2.5:Playground是一个免费的在线AI图像生成器

    Playground是一个免费的在线AI图像生成器,用户可以使用它来创造艺术作品、社交媒体帖子、演示文稿、海报、视频、标志以及更多。它采用了当前最先进的视觉模型,可以高质量生成各种风格和内容的图片。主要功能和优势包括:1)强大的图像生成能力,可根据文字描述生成细节丰富的图片;2)支持多种生成风格,如写实、动漫等;3)支持生成高清大图;4)可自定义生成图片样式,如颜色、构图等;5)免费使用,无需登录;6)简单易用的网页界面。

  • chat-with-mlx:在Apple Silicon上原生使用MLX框架与数据对话

    chat-with-mlx是一个展示如何在Apple Silicon上使用MLX框架进行原生对话的库。它支持多种开源模型,可以轻松集成任何HuggingFace和MLX兼容的开源模型。

  • AutoPrompt:基于意图的提示校准框架

    AutoPrompt是一个用于提示优化的框架,旨在通过意图校准过程自动生成高质量、详细的提示,以适应用户意图。该框架通过迭代构建挑战性边缘案例数据集并相应优化提示,减少手动提示工程的工作量,并有效解决提示敏感性和固有的提示歧义问题。

  • LTX Studio:AI驱动的一站式视频制作平台

    LTX Studio是一个集成了AI技术的创新视频制作平台,它允许用户从概念到最终剪辑,全面控制视频的各个方面。该平台通过AI技术,将创意转化为连贯的视频故事,提供角色一致性、自动编辑、深度帧控制等功能,旨在简化视频制作流程,提高创作效率。

  • MorphStudio:Morph Studio可以帮助用户通过文本提示创造出独特的视频

    Morph Studio是一个基于人工智能的文本到视频生成平台。它使用先进的算法,可以通过用户提供的文本提示,自动生成高质量的视频。Morph Studio使创作者可以将自己的创意快速实现成动态的视觉内容。它极大地降低了视频制作的门槛,用户无需具备专业技能和昂贵设备,就可以创造出独特的视频作品。此外,Morph Studio还提供了强大的自定义功能,用户可以调整生成视频的长度、分辨率、样式等参数,输出结果更符合自己的需求。总之,这是一款极具创新和颠覆性的人工智能产品。

  • Borea AI:解锁智能财务掌握

    Borea AI是一款颠覆金融和投资传统的创新平台,通过提供AI驱动的工具和洞察力,帮助您做出明智的决策,助您成功。

  • AutoPitch.ai:AutoPitch是一个AI助手,可以在几秒钟内编写技术外联邮件

    AutoPitch是一个AI助手,可以在几秒钟内编写技术外联邮件。它从6个数据源和先进的AI模型中获取数据,帮助销售人员更好地研究和销售技术产品。AutoPitch深入了解产品的特性、技术细节等,并自动生成账户研究报告。它还可以帮助您编写与潜在客户的角色、公司和行业相关的个性化销售信息。通过AutoPitch,您可以节省每个账户1小时的时间。

  • LayerDiffusion:用SD直接生成透明的 PNG 图片

    LayerDiffusion 是一种使大规模预训练潜在扩散模型能够生成透明图像的方法。该方法允许生成单个透明图像或多个透明图层。它学习了一种 “潜在透明度”,将 Alpha 通道透明度编码到预训练潜在扩散模型的潜在空间中。通过将添加的透明度调节为潜在偏移,最小程度地改变预训练模型的原始潜在分布,以保留大型扩散模型的生产就绪质量。通过调整潜在空间对其进行微调,可以将任何潜在扩散模型转换为透明图像生成器。我们使用人机协作收集的 100 万个透明图像层对对模型进行训练。我们展示了潜在透明度可以应用于不同的开源图像生成器,或者适应于各种条件控制系统,实现前景 / 背景条件图层生成,联合图层生成,图层内容结构控制等应用。用户研究发现,在大多数情况下(97%),用户更喜欢我们本地生成的透明内容,而不是之前的临时解决方案,比如生成然后抠图。用户还报告说,我们生成的透明图像的质量与 Adobe Stock 等真实商业透明资产相媲美。

  • DiffuseKronA:参数高效微调个性化扩散模型

    DiffuseKronA 是一种参数高效的微调方法,用于个性化扩散模型。它通过引入基于 Kronecker 乘积的适配模块,显著降低参数数量,提升图像合成质量。该方法减少了对超参数的敏感性,在不同超参数下生成高质量图像,为文本到图像生成模型领域带来重大进展。

  • Einstein Copilot:成为 AI 第一公司的终极解决方案

    Salesforce Einstein 是您成为 AI 第一公司的端到端解决方案。利用我们 AI 技术在客户数据中创建可定制、预测性和生成性 AI 体验,安全地满足您所有的业务需求。通过 Einstein,在任何工作流程、用户、部门和行业中引入对话式 AI。

  • EMO:通过音频生成充满表情的肖像视频

    阿里巴巴的EMO: 是一款生成具有表情丰富的面部表情视频的工具,可以根据输入的角色图像和声音音频生成各种头部姿势和表情的声音头像视频。支持多语言歌曲和各种肖像风格,能够根据音频节奏生成动态、表现丰富的动画角色。

  • toona:批量给黑白漫画上色的工具

    toona 是一个将漫画图像上色的工具,让漫画生动起来。用户可以通过给漫画图像添加色彩来提升视觉效果,增加乐趣。无需专业绘画技能,一键即可实现。

  • 青梧字幕:智能提取视频字幕

    青梧字幕是一款视频字幕自动提取工具,用户可以通过选中本地视频文件自动生成字幕,进行编辑和翻译,最终可以下载多种格式的字幕文件。产品功能全面,支持高质量翻译和多种字幕格式下载,适用于视频制作、学习教育等场景。

  • C3PO:基于用户反馈的 LLM 模型对齐技术

    C3PO 是一种基于用户反馈的 LLM 模型对齐技术,可以从单个反馈句子中对 LLM 进行调整,避免过度概括化。该技术提供了参考实现、相关基准线和必要组件,方便研究论文中提出的技术。

  • OpenDiT::一款简单、快速、高效的DiT训练和推理系统

    OpenDiT是一个开源项目,提供了一个基于Colossal-AI的Diffusion Transformer(DiT)的高性能实现,专为增强DiT应用(包括文本到视频生成和文本到图像生成)的训练和推理效率而设计。OpenDiT通过以下技术提升性能:在GPU上高达80%的加速和50%的内存减少;包括FlashAttention、Fused AdaLN和Fused layernorm核心优化;包括ZeRO、Gemini和DDP的混合并行方法,还有对ema模型进行分片进一步降低内存成本;FastSeq:一种新颖的序列并行方法,特别适用于DiT等工作负载,其中激活大小较大但参数大小较小;单节点序列并行可以节省高达48%的通信成本;突破单个GPU的内存限制,减少整体训练和推理时间;通过少量代码修改获得巨大性能改进;用户无需了解分布式训练的实现细节;完整的文本到图像和文本到视频生成流程;研究人员和工程师可以轻松使用和调整我们的流程到实际应用中,无需修改并行部分;在ImageNet上进行文本到图像训练并发布检查点。

  • WMTA project (beta):AI识别非洲艺术品

    Whomadethisartwork.com是一个利用人工智能识别非洲艺术品的网站。通过上传或粘贴照片,AI模型可以准确识别艺术品,提供相关的艺术家、艺术品介绍等信息。该平台还提供了文档记录、艺术品鉴定、艺术家推广等功能,旨在保护和推广非洲艺术遗产。

  • Map Lead Scraper:从Google Maps抓取本地商家数据

    Map Lead Scraper是一个从Google Maps抓取工具,可以帮助用户提取Google Maps上的信息。它可以提取本地商家数据和联系方式,节省大量手动搜索的时间。可以自动生成潜在客户名单,包括名称、电话、邮箱等信息。

  • ChatMusician:集成音乐能力的开源LLM

    ChatMusician是一个开源的大型语言模型(LLM),它通过持续的预训练和微调,集成了音乐能力。该模型基于文本兼容的音乐表示法(ABC记谱法),将音乐视为第二语言。ChatMusician能够在不依赖外部多模态神经结构或分词器的情况下,理解和生成音乐。

  • MobiLlama:为边缘设备定制的小型语言模型

    MobiLlama是一个为资源受限设备设计的小型语言模型(SLM),它旨在提供准确且轻量级的解决方案,以满足设备上的处理需求、能效、低内存占用和响应效率。MobiLlama从更大的模型出发,通过精心设计的参数共享方案来降低预训练和部署成本。

今日大家都在搜的词: