AI驱动的未来:探索人工智能的无限潜力 | 开源专题 No.39

news/2024/7/10 20:36:13 标签: 人工智能, 开源

picture

这一系列开源项目代表着多个领域的最新技术成果,包括深度学习、自然语言处理、计算机视觉和分布式训练。它们共同的特点是致力于教育、资源分享、开源精神、多领域应用以及性能和效率的追求,为广大开发者、研究者和学生提供了宝贵的工具和知识,推动了人工智能领域的不断发展和创新。

d2l-ai/d2l-zh

Stars: 46.5k License: Apache-2.0

picture

开源项目代表了我们的一种尝试:我们将教给读者概念、背景知识和代码;我们将在同一个地方阐述剖析问题所需的批判性思维、解决问题所需的数学知识,以及实现解决方案所需的工程技能。
我们的目标是创建一个为实现以下目标的统一资源:

  • 所有人均可在网上免费获取;
  • 提供足够的技术深度,从而帮助读者实际成为深度学习应用科学家:既理解数学原理,又能够实现并不断改进方法;
  • 包含可运行的代码,为读者展示如何在实际中解决问题。这样不仅直接将数学公式对应成实际代码,而且可以修改代码、观察结果并及时获取经验;
  • 允许我们和整个社区不断快速迭代内容,从而紧跟仍在高速发展的深度学习领域;
  • 由包含有关技术细节问答的论坛作为补充,使大家可以相互答疑并交换经验。

openai/whisper

Stars: 36.9k License: MIT

Whisper是一个通用的语音识别模型,它通过大规模弱监督训练了多样化的音频数据,并且可以执行多语言语音识别、语音翻译和语种鉴定等任务。该项目采用Transformer sequence-to-sequence 模型,在各种处理任务中进行训练,使用一组特殊标记作为任务指示器或分类目标。这使得单个模型能够替代传统的多阶段流程,提高效率并降低成本。

优点:

可用性:

  • 提供五种不同大小版本的预训练模型及其对应内存需求。
  • 支持Python 3.8以上版本,并依赖于部分第三方库(如tokenizers)。

CMU-Perceptual-Computing-Lab/openpose

Stars: 27.9k License: NOASSERTION

picture

OpenPose 是一个开源项目,它是第一个能够在单个图像上联合检测人体、手部、面部和脚步关键点 (总共 135 个关键点) 的实时多人系统。该项目具有以下核心优势:

  • 2D 实时多人关键点检测功能
  • 支持 15,18 或 25 个身体/足迹关键点估计,并包括 6 个足迹关键点。运行时间与被检测到的人数无关。
  • 支持 2x21 个手部关节点估计,运行时间取决于被检测到的人数。
  • 支持 70 个面部特征点估计,运行时间取决于被检测到的人数。
  • 实时 3D 单一用户骨架姿态识别:支持从多视角进行三维重建;处理 Flir 相机同步;兼容 Flir / Point Grey 相机;
  • 提供校准工具箱以用来评价失真度,内参和外参等摄像头参数。

microsoft/DeepSpeed

Stars: 24.2k License: Apache-2.0

DeepSpeed是一个深度学习优化库,使分布式训练和推理变得简单、高效和有效。它能够在资源受限的GPU系统上进行训练/推理,并实现了模型参数数十亿或万亿级别的密集或稀疏模型的训练/推理。此外,它还可以以前所未有的低延迟和高吞吐量进行推断,并且具有极端压缩功能来减少成本并提供无与伦比的推断速度和模型大小缩小。 DeepSpeed软件套件包括三个创新支柱:DeepSpeed-Training、DeepSpeed-Inference 和 DeepSpeed-Compression, 分别用于大规模DL训练、超大规模DL预测及其压缩技术等领域。

geohot/tinygrad

Stars: 11.8k License: MIT

tinygrad是一个深度学习框架,其核心代码不足1000行。它的设计目标是简单易用,并且容易添加新的加速器支持。虽然功能较少,但支持基本操作和一些SOTA模型(如efficientnet.py和transformer.py)。另外还提供了对Apple Neural Engine和Google TPU等硬件加速器的支持。


http://www.niftyadmin.cn/n/5106477.html

相关文章

如何使用前端Web组件?

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅:探索Web开发的奇妙世界 欢迎来到前端入门之旅!感兴趣的可以订阅本专栏哦!这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

ant的FileSet资源集合

一个FileSet是一组文件&#xff0c;这些文件可以通过从基目录开始的目录树中找到FileSet可以指定模式集和选取器来进行过滤和选择。 FileSet隐含已经支持的模式集<include>, <includesfile>, <exclude> 和 <excludesfile>&#xff0c;它们作为FileSet的…

使用 ClickHouse 深入了解 Apache Parquet (一)

​ 【squids.cn】 全网zui低价RDS&#xff0c;免费的迁移工具DBMotion、数据库备份工具DBTwin、SQL开发工具等 自2013年作为Hadoop的列存储发布以来&#xff0c;Parquet几乎已经成为一种无处不在的文件交换格式&#xff0c;它提供了高效的存储和检索。这种采纳使其成为更近期的…

CAdUiPaletteSet创建后乱码 2023/10/17 下午11:25:07

2023/10/17 下午11:25:07 CAdUiPaletteSet创建后乱码 2023/10/17 下午11:25:53 对于CAdUiPaletteSet创建后出现乱码的问题,可能有以下几种原因和解决办法: 字体设置:检查一下字体设置是否正确。可以尝试更换字体或者调整字体大小,看看是否能够解决乱码问题。 字符集设…

阿里云安装 redis

1、在opt目录下面安装redis https://download.redis.io/redis-stable.tar.gz redis的最新稳定版本。更多版本可见 redis cd /opt wget https://download.redis.io/redis-stable.tar.gz2、解压tar包&#xff0c;会生成redis-stable文件夹 tar -xzvf redis-stable.tar.gz3、安装…

spug-机器管理平台

一、安装 https://spug.cc/en/docs/install-docker/ 二、Spug“账户已被系统禁用”解决方法 登陆spug容器里重置密码 # reset passwordpython3 /data/spug/spug_api/manage.py user reset -u admin -p 123456# enable userpython3 /data/spug/spug_api/manage.py user enabl…

麒麟系统开发笔记(十三):在国产麒麟系统上编译OSG库、搭建基础开发环境和移植测试Demo

若该文为原创文章&#xff0c;转载请注明原文出处 本文章博客地址&#xff1a;https://hpzwl.blog.csdn.net/article/details/133943583 红胖子网络科技博文大全&#xff1a;开发技术集合&#xff08;包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软硬…

【限时免费】20天拿下华为OD笔试之【回溯】2023Q1-硬件产品销售方案【欧弟算法】全网注释最详细分类最全的华为OD真题题解

【回溯】2023Q1-硬件产品销售方案 题目描述与示例 题目描述 某公司目前推出了 AI 开发者套件、AI 加速卡、AI 加速模块、AI 服务器、智能边缘多种硬件产品&#xff0c;每种产品包含若干个型号。现某合作厂商要采购金额为 amount 元的硬件产品搭建自己的 AI 基座。假设当前库…