AIneon CG&AI 本周快讯 (1.1-1.8)

导读:

欢迎来到AIneon CG&AI 本周快讯。本期内容,AI技术在政治广告、AI搜索、硬件加速器、家庭机器人等领域进展。亮点包括政治领域AI声音克隆技术的使用,Perplexity AI挑战搜索引擎巨头,OpenAI即将推出GPT Store,英特尔Gaudi2处理器超越Nvidia,斯坦福ALOHA机器人和OpenVoice语音克隆技术的创新,以及版权法律和CG创新的新动向。这些进展展示了AI和CG技术的快速发展及伴随的伦理和社会责任问题。


  1. AI声音克隆技术在政治广告中应用:2024年美国大选中,新兴的AI声音克隆技术被用于政治广告,引发虚假信息担忧。
  2. Perplexity AI完成融资挑战搜索引擎巨头:AI搜索公司Perplexity AI完成7400万美元融资,计划挑战Google和Microsoft Bing的市场地位。
  3. OpenAI推出GPT Store:OpenAI将推出GPT Store,为第三方自定义GPT的创建者提供一个新的销售和盈利化平台。
  4. 英特尔Gaudi2超越Nvidia:Databricks的研究表明,英特尔的Gaudi2处理器在AI加速器领域的性价比上超越了Nvidia。
  5. 斯坦福开发ALOHA机器人:斯坦福大学研发的ALOHA机器人能够从人类学习完成家务任务,展现AI在家庭环境中的应用潜力。
  6. OpenVoice引领语音克隆技术革新:MyShell推出的开源AI语音克隆模型OpenVoice,为语音模拟技术带来创新和广泛应用。
  7. 纽约时报对OpenAI提起版权诉讼:纽约时报对OpenAI及Microsoft提起的版权侵权诉讼,可能对AI技术的未来和版权法律带来重大影响。
  8. Kiri Engine支持3D高斯涂抹技术:Kiri Innovations更新其3D扫描应用Kiri Engine,加入对3D高斯涂抹技术的支持,推动CG创新。
  9. 《万智牌》使用AI创作引争议:Wizards of the Coast在其《万智牌》游戏营销活动中使用AI生成图像,引发关于AI在创意产业应用的争议和讨论。

01
2024年政治广告的新浪潮:声音克隆技术引发虚假信息担忧

引言:在即将到来的2024年美国大选中,一项新兴技术——AI声音克隆技术,正在改变政治广告的面貌。虽然这一技术引发了关于虚假信息的担忧,但它正被越来越多的政治竞选团队采用。

内容摘要:

  • *技术应用:**佛罗里达州博卡拉顿的Instreamatic公司,一个AI音频/视频广告平台,正在将其能力扩展到政治广告领域。这个平台允许竞选团队快速生成高度针对性的AI驱动的视频和音频广告。
  • *广告创新:**这些广告使用语音而非真人视频,能够根据不断变化的事件或地点进行适应。Instreamatic已经自去年三月起向品牌和代理机构提供其生成语音AI产品,声称可以从单个完成的广告中自动生成无限版本的广告。
  • *虚假信息风险:**尽管Instreamatic公司的CEO Stas Tushinskiy坚称公司已建立保障措施以避免其产品被用于选举虚假信息,但2024年美国选举中AI的使用预计将成为一个虚假信息的雷区,且已引起警示。
  • *AI和政治广告:**当前,关于政治竞选中使用AI生成内容(如广告)还没有联邦规则。这使得AI在政治广告中的应用处于灰色地带,潜在的风险和问题尚未得到解决。
  • *审慎的优化:**Instreamatic致力于简化和自动化现有的繁琐政治广告过程,而不是重新定义政治广告的世界。Tushinskiy强调,虽然公司提供了更有效的工具,但如果发现有人不道德地使用这些工具,公司不仅可以停止这种行为,还可以曝光它。

这项技术的发展和应用表明了AI在政治领域的深入渗透,同时也凸显了伴随技术进步而来的伦理和社会责任问题。随着选举日的临近,公众对于如何确保这项技术的正当和安全使用持续关注。


02
Perplexity AI以7400万美元迎战Google和Microsoft Bing

引言:在AI搜索领域,Perplexity AI刚完成7400万美元的融资,旨在挑战Google Search和Microsoft Bing的主导地位。这家年轻的创业公司通过其AI本土搜索引擎,计划重塑知识发现领域。

内容摘要

  • *融资里程碑:**加州的Perplexity AI宣布完成了7300万美元的B轮融资,迄今共筹集了1亿美元,估值超过5亿美元。该轮融资由IVP牵头,NEA、Databricks、Nvidia、Bessemer Venture Partners和Kindred Ventures参与。
  • *名人投资者支持:**包括亚马逊创始人杰夫·贝佐斯、GitHub CEO Nat Friedman、Shopify CEO Tobi Lutke在内的多位科技界领袖加入了投资者名单。
  • *AI原生搜索体验:**Perplexity AI提供的是一个将网络索引与多种AI模型结合的知识搜索平台,其完全对话式的用户体验无需点击不同链接,也无需比较答案或无休止地寻找信息。
  • *详细探索功能:**该平台还允许用户深入探索所提供信息的相关来源和引用,从而改善搜索体验。
  • *应对虚假信息:**Perplexity AI的共同创始人兼CEO Aravind Srinivas在博客文章中写道,考虑到虚假信息和AI幻觉日益引起的担忧,准确性和透明度是使AI驱动的搜索无处不在的先决条件。
  • *高增长但面临挑战:**Perplexity AI一年前推出其搜索引擎,已经获得了1000万月活跃用户和100万移动用户。Srinivas指出,该平台在2023年处理了超过5亿个查询,尤其在学术界、学生和知识工作者中获得了特别的关注。
  • *与行业巨头竞争:**虽然Google和Microsoft在将生成型AI整合到其搜索引擎中已有所行动,但Perplexity AI的独特功能和灵活性可能会在AI时代的知识发现中占据一席之地。

这一轮融资和Perplexity AI的发展,标志着AI搜索领域竞争的新阶段。随着公司在AI驱动的搜索解决方案上的进一步发展,它有可能成为未来搜索技术的领军者。


03
开启AI时代新篇章:OpenAI GPT Store下周上线

引言:OpenAI即将在下周推出其革命性的GPT Store,这标志着生成式人工智能(AI)领域迈入一个新时代。此举旨在为第三方自定义GPT的创建者提供一个全新的平台,以销售和盈利化他们的创新作品。

内容摘要:

  • *商店推出背景:**OpenAI,作为ChatGPT的幕后公司,一直致力于将生成式AI技术普及。现在,他们正准备在2024年1月8日至13日推出GPT Store,为使用OpenAI新推出的GPT Builder构建的第三方自定义GPT提供销售平台。
  • *自定义GPT的潜力:**通过GPT Builder,用户可以构建基于OpenAI强大的大型语言模型GPT-4的定制GPT。这些定制GPT可以针对特定用途进行优化,例如特定行业的客户服务、教育应用或娱乐内容。
  • *开放性和无门槛入驻:**GPT Store具备对所有人开放的特性,不要求开发者具备专业软件开发经验。任何人只要有想法,就可以利用ChatGPT Builder将其实现,并在GPT Store上销售。
  • *市场影响:**这一举措可能会像苹果的App Store对移动应用生态系统的影响一样,为AI时代的应用程序和服务开启新的市场渠道。
  • *挑战和争议:**尽管GPT Store的推出备受期待,但其中也不乏挑战和争议。例如,OpenAI将如何确保平台的质量和安全,以及他们将如何从定制GPT的销售中抽成等问题。

这次GPT Store的推出预示着AI技术商业化的一个重要里程碑,也可能会激发一系列创新和创业活动。随着商店的开放,OpenAI有望引领一个全新的AI应用时代。


04
Databricks研究确认:英特尔Gaudi超越Nvidia,成为AI加速器性价比之王

引言:在AI加速器领域,英特尔的Gaudi2处理器已经在性价比上超越了Nvidia,这一发现来自Databricks的最新研究。这一成果不仅展示了英特尔在AI硬件竞争中的崛起,也为AI加速器市场带来了新的竞争格局。

内容摘要:

  • *研究发现:**Databricks的研究显示,Gaudi 2在大型语言模型(LLM)推理方面,与Nvidia H100的延迟匹配,并超越了Nvidia A100。Gaudi 2的推理实现了比H100和A100更高的内存带宽利用率。
  • *性价比优势:**根据Databricks的研究,基于公共云定价,Gaudi 2在训练和推理方面具有最佳的性价比,相比于Nvidia的A100和H100。
  • *英特尔的持续发展:**英特尔已在2019年以20亿美元收购AI芯片初创公司Habana Labs及其Gaudi技术,并自那时以来不断改进这一技术。
  • *性能和成熟度:**尽管英特尔的Gaudi 2在Databricks的研究中表现出色,但英特尔仍在通过MLcommons MLperf基准测试,展示其训练和推理方面的性能和成熟度。
  • *即将推出的Gaudi 3:**英特尔正准备于2024年推出Gaudi 3 AI加速器技术。Gaudi 2基于7纳米工艺开发,而Gaudi 3则基于5纳米工艺,将提供4倍的处理能力和双倍的网络带宽。
  • *长远规划:**展望未来,英特尔正在研发将高性能计算(HPC)和AI加速器技术融合的未来世代产品。同时,英特尔也在其CPU技术中看到了AI推理工作负载的价值,最近宣布了配备AI加速功能的第5代Xeon处理器。

英特尔Gaudi在AI加速器市场的表现证明了公司在AI硬件领域的竞争力和创新能力。随着Gaudi 3的即将推出和长远规划的展开,英特尔在AI加速领域的地位有望进一步提升。


05

ALOHA机器人:人类的新厨师、清洁工和洗衣师

引言:斯坦福大学的研究人员开发了ALOHA机器人,这是一款能够从人类学习做饭、清洁和洗衣等家务活的移动机器人。这项突破性技术不仅展示了机器人在家庭环境中的实用性,也预示了AI在日常生活中的更广泛应用。

内容摘要:

  • *技术革新:**ALOHA(低成本开源硬件系统,用于双手操作的远程操作)是一个移动机器人系统,它通过人类示范学习复杂的任务,并可在不同环境中执行。
  • *成本效益:**ALOHA的成本仅为传统系统的一小部分,仅需50次人类示范即可学习,相比高达20万美元的市售双手机器人,ALOHA的总成本大约为32,000美元,包括网络摄像头和配备消费级GPU的笔记本电脑。
  • *家务应用:**ALOHA已经展示了其在烹饪三道菜、打蛋、切蒜、倒液体、拆包装蔬菜和煎鸡肉等细腻任务上的能力。除此之外,它还可以执行各种家务任务,如浇花、使用吸尘器、装卸洗碗机、从冰箱取饮料、开门和操作洗衣机等。
  • *模仿学习和共同训练:**ALOHA利用变压器架构进行学习,这是大型语言模型中使用的技术。它通过远程操作系统进行任务演示,然后利用这些数据通过端到端模仿学习来训练控制系统。
  • *发展前景:**尽管ALOHA在技术上取得了卓越成果,但其笨重的体积和形态限制了在狭小环境中的应用。研究人员计划通过增加自由度和减小机器人体积来改进系统。

ALOHA机器人的开发不仅展示了AI和机器学习在日常任务中的潜力,也为未来家庭和消费级有用机器人的发展铺平了道路。随着技术的进步,我们可能很快就会在家中迎来这样的智能助手。


06
MyShell推出开源AI语音克隆技术OpenVoice

引言:MyShell,一家AI初创公司,最近发布了OpenVoice,这是一个开源的AI语音克隆模型,旨在为大众提供快速、精确的语音模拟技术。这一举动可能会彻底改变语音克隆领域的格局,为研究和创新打开新的大门。

内容摘要:

  • *技术突破:**OpenVoice由麻省理工学院(MIT)、清华大学的研究人员以及AI初创公司MyShell的成员共同开发。这一模型能够几乎瞬间克隆语音,并提供其他语音克隆平台所没有的细致控制。
  • *精准和灵活:**OpenVoice允许用户以前所未有的精确度克隆语音,通过对音调的精细控制,从情感到口音、节奏、停顿和语调都能调整。
  • *开源优势:**与其他初创公司如ElevenLabs通过开发专有算法和AI软件进行语音克隆不同,MyShell的OpenVoice作为开源模型提供,让更广泛的用户和开发者能够访问和改进这一技术。
  • *使用体验:**测试显示,使用OpenVoice,用户无需读特定的文本即可克隆自己的声音。用户可以即兴说话几秒钟,模型就会生成语音克隆,并能立即回放用户提供的文本提示。
  • *技术构成:**OpenVoice包括两个不同的AI模型:文本到语音(TTS)模型和“音调转换器”。这两个模型一起工作,可以再现用户的声音,并改变文本被说出时的“音调色彩”或情感表达。
  • *创新与挑战:**OpenVoice的推出可能会在语音合成领域引发一系列创新和挑战,特别是在如何确保这一技术的负责任使用方面。

OpenVoice的推出不仅展示了AI在语音克隆领域的巨大潜力,也可能成为开源AI研究和应用的一个重要里程碑。随着技术的发展,我们可以期待在各种应用领域看到更多由OpenVoice驱动的创新。


07
纽约时报对OpenAI的版权诉讼:2024年值得关注的版权战

引言:在版权领域,纽约时报对OpenAI及Microsoft提起的版权侵权诉讼已成为2024年最重要的版权争议之一。这起诉讼不仅可能影响AI技术的未来,也可能引发更广泛的版权法律变革。

内容摘要:

  • *诉讼背景:**纽约时报指控OpenAI和Microsoft侵犯版权,要求他们支付“数十亿美元”的法定和实际损害赔偿,并要求销毁使用纽约时报版权材料的聊天机器人模型和训练数据。
  • *潜在的法律影响:**法律专家长期以来预测AI和版权的案件可能会上诉至美国最高法院。纽约时报对OpenAI和Microsoft的诉讼可能成为这一预测的现实。
  • *版权与AI的碰撞:**自2022年以来,版权与生成型AI的战斗已酝酿超过一年。这一领域的法律指导尚不明确,预计会涉及对大型数据集使用和开源许可的公平使用与侵权之争。
  • *行业对版权的关注:**受生成型AI影响的行业,如出版和娱乐,正在积极关注版权问题。纽约时报的诉讼可能成为关注焦点,特别是在新闻行业。
  • *版权法的适用性和变革:**OpenAI的律师团队准备积极辩护,认为技术公司在版权问题上的立场应该并有望获胜。版权法往往被用来解决它原本不打算解决的问题,这可能导致版权法的改革和发展。

纽约时报对OpenAI和Microsoft的诉讼,可能成为版权法在AI时代的一个关键转折点。这场法律战可能不仅会塑造创新的步伐和轮廓,还可能改变人们对版权法角色的理解。随着案件的发展,这一诉讼可能成为版权法和AI技术交叉领域的一个里程碑。


08

Kiri Engine引入3D高斯涂抹技术,开启CG创新新篇章

引言:Kiri Innovations最近更新了其3D扫描应用Kiri Engine,增加了对3D高斯涂抹(3D Gaussian Splatting,简称3DGS)技术的支持。这项更新不仅为Android和iOS用户带来了前所未有的3D重建能力,也标志着AI在CG创新中的新飞跃。

内容摘要:

  • *技术革新:**Kiri Engine是一款用于Android和iOS设备的3D扫描应用。最新的3.0更新增加了对3D高斯涂抹(3DGS)的支持,这是Kiri Innovations声称在Android上的首次尝试。
  • *应用特性:**3DGS技术开始于从一组源照片生成3D对象或场景的点云,然后使用机器学习将点云转换为高斯分布,以确定每个点的正确颜色。
  • *高质量成果:**这种方法的结果是高质量且可能快速渲染的3D对象或场景表示。
  • *软件更新和功能:**除了3DGS技术外,Kiri Engine还支持神经表面重建和iOS设备上的激光扫描。应用内还可以编辑3DGS数据以清理扫描结果,并以PLY格式导出以用于Unity或Unreal Engine等软件。
  • *价格和系统要求:**Kiri Engine 3.5适用于Android 7.0和iOS 15.0。新的3DGS功能仅向付费Pro账户用户开放。免费基础账户包括摄影测量、激光扫描和对象捕捉,并且每周可以从云端导出三个3D扫描。
  • *竞争和创新:**尽管其他3D扫描应用(如Polycam)在其iOS版本中支持创建和查看3D高斯涂抹,但Kiri Innovations声称Kiri Engine是首个在Android上做到这一点的应用。

Kiri Engine的这一更新展示了AI技术在CG领域的进步和应用,同时为Android和iOS用户提供了一个强大的3D扫描工具。随着技术的不断发展,Kiri Engine可能会为3D重建和CG创作开辟新的可能性。


09
《万智牌》使用AI创作引争议:Wizards of the Coast坦承AI协助创作

引言:Wizards of the Coast最近因在其著名游戏《万智牌》的营销活动中使用AI生成图像而引发争议。该公司最初否认使用AI,但随后承认在创作过程中确实使用了AI元素。

内容摘要:

  • *营销活动引发质疑:**Wizards of the Coast在推特上发布了一张《万智牌》的宣传图,引起了粉丝和社区成员的关注。许多人指出,该图像中有部分看起来像是AI生成的,存在一些明显的不自然元素。
  • *公司的初始否认:**尽管社区成员指出了一些明显的问题,Wizards of the Coast起初坚称该图像完全由人手创作,否认了AI的参与。
  • *最终的承认:**经过几天的批评后,Wizards of the Coast终于承认在创作该宣传图时,确实使用了AI元素。公司表示,虽然整体图像是由人类完成的,但在营销创意过程中有一些AI元素“悄然融入”。
  • *第三方责任:**在处理这一情况时,公司主要指责了一家匿名的第三方“供应商”,声称他们的失误不在于使用AI,而在于未能注意到这一点并遵循其在2023年12月分享的关于生成型AI的政策。
  • *社区反应:**这一事件引起了社区的广泛不满,许多评论者同时批评了公司及其回应。有观点指出,这反映了公司对其游戏和艺术价值的轻视。
  • *关于未来的担忧:**Wizards of the Coast此次事件再次激发了关于AI在艺术创作中角色的讨论,同时也引发了对于游戏和其他创意产业未来发展的担忧。

Wizards of the Coast在《万智牌》宣传活动中使用AI的经历,凸显了生成型AI技术在创意产业中的应用及其带来的伦理和实践挑战。这一事件可能会对游戏行业中AI使用的未来趋势产生重要影响。




感谢观看AIneon CG&AI 本周快讯。我们希望这些精选的新闻为您提供了深刻洞见和灵感。随着AI和CG领域的不断进步,我们将继续与您一起探索这个充满活力的技术世界。下周,更多激动人心的内容等待着您的关注。再次感谢,期待您的持续关注。