互联网时代的文学复兴:中文诗词大数据分析 | 开源日报 No.170

news/2024/7/10 22:18:05 标签: 开源

picture

chinese-poetry/chinese-poetry

Stars: 45.4k License: MIT

picture

最全的中文诗歌古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。数据来源于互联网。该开源项目旨在通过 JSON 格式分发,方便用户开始自己的项目,并借助技术生成格式化 (JSON) 数据来构建诗词类应用程序。案例展示了一些基于该仓库创建的相关应用。

  • 数据集丰富
  • 古代中国各种经典作品齐全
  • 提供高频次分析图等功能
  • 开放给用户参与贡献

citra-emu/citra

Stars: 8.8k License: GPL-2.0

Citra 是世界上最受欢迎的开源任天堂 3DS 模拟器。该项目使用 C++ 编写,注重可移植性,并积极维护适用于 Windows、Linux、Android 和 macOS 的版本。

以下是 Citra 项目的关键特性和核心优势:

  • 兼容性:该模拟器能够以全速运行大多数商业游戏,前提是您满足必要的硬件需求。
  • 多平台支持:Citra 提供了针对不同操作系统 (Windows、Linux、Android 和 macOS) 的构建版本,方便用户在各种设备上体验游戏。
  • 持续更新与发展:团队定期发布新功能和进度报告,在 GitHub 上进行活跃地开发讨论,并通过 Discord 群组为贡献者们提供交流机会。
  • 易于安装和使用:可以从官网下载并安装 Nightly 或 Canary 版本;此外还有 Android 版本可在 Google Play 商店中获取。同时也提供 Flatpak 构建来简化部署过程。

e2b-dev/E2B

Stars: 5.6k License: Apache-2.0

这个项目是一个为 AI 应用程序和代理人提供的安全沙盒云环境,允许它们长时间运行。E2B Sandbox 可以连接到任何 LLM 和任何 AI 代理或应用程序,并且具有以下主要功能:

  • 可以使用与人类相同的工具
  • 具有云浏览器、GitHub 存储库和命令行界面等功能
  • 支持编码工具如代码检查、自动补全、“跳转至定义”
  • 能够运行由 LLM 生成的代码

该项目包含 Python SDK、JS SDK、CLI 以及文档等内容。

hemansnation/God-Level-Data-Science-ML-Full-Stack

Stars: 3.4k License: NOASSERTION

这个项目是一个数据科学和机器学习全栈的集合,包括了科学方法、流程、算法和系统来构建故事与模型。主要功能包括 Python 编程逻辑搭建、数据结构与算法以及 Git & GitHub 等内容。该项目的核心优势和特点有:

  • 包含 16 章节的路线图,涵盖从新手到经验专业人士转向数据科学与 AI 所需的知识;
  • 提供丰富资源库,并使用多种技术栈如 Python,NumPy,Pandas,Matplotlib 等工具进行实践;
  • 重点介绍了各阶段需要掌握的关键概念和技能,例如统计分析、机器学习算法应用以及自然语言处理等。

ricklamers/gpt-code-ui

Stars: 3.3k License: MIT

picture

这个项目是 OpenAI 的 ChatGPT 代码解释器的开源实现。用户可以简单地向 OpenAI 模型提出要求,它将为您生成并执行代码。该项目具有以下主要功能和核心优势:

  • 文件上传
  • 文件下载
  • 上下文感知 (可以参考先前的消息)
  • 生成代码
  • 运行代码 (Python 内核)
  • 模型切换 (GPT-3.5 和 GPT -4)

http://www.niftyadmin.cn/n/5378982.html

相关文章

C#(C Sharp)学习笔记_编程练习题 _输出奇偶数, 九九乘法表, 猜数字游戏【八】

1. 输出奇偶数 要求:输出从1到100的所有偶数 分析: 首先我们需要用到循环(while也好,for也好,但for会更加优雅),输出0到100的所以数。在for的循环体内写入if条件判断语句,条件表达…

Ubuntu Desktop 显示文件路径

Ubuntu Desktop 显示文件路径 1. GUI hot key2. CLIReferences 1. GUI hot key Ctrl L: 显示文件路径 2. CLI right click -> Open in Terminal -> pwd strongforeverstrong:~/Desktop$ pwd /home/strong/DesktopReferences [1] Yongqiang Cheng, https://yongqiang…

MySQL的JDBC操作、pymysql操作

JDBC JDBC (Java DataBase Connectivityjava数 据库连接)是一种用于执行SQL语句的Java API。 JDBC是Java访问数据库的标准规范,可以为不同的关系型数据库提供统一访问, 它由一组用Java语言编写的接口和类组成。 JDBC需要连接驱动,驱动是两个设…

中小学信息学奥赛CSP-J认证 CCF非专业级别软件能力认证-入门组初赛模拟题第三套(选择题)

CSP-J入门组初赛模拟练习题第三套 1、以下不是属于国家顶级域名的是 A、.au B、.cn C、.com D、.jp 答案:C 考点分析:主要考查域名相关知识,au是澳大利亚、cn是中国,jp是日本,答案C 2、2个10进制数1111和1010的异…

Python iter函数

在Python编程中,iter()函数是一个非常重要且常用的内置函数,用于生成迭代器对象。迭代器是一种可以逐个访问数据元素的对象,可以用于遍历序列、集合以及自定义数据结构等。本文将深入探讨Python中的iter()函数,包括基本用法、可迭…

HTML | DOM | 网页前端 | 常见HTML标签总结

文章目录 1.前端开发简单分类2.前端开发环境配置3.HTML的简单介绍4.常用的HTML标签介绍 1.前端开发简单分类 前端开发,这里是一个广义的概念,不单指网页开发,它的常见分类 网页开发:前端开发的主要领域,使用HTML、CS…

英伟达(NVIDIA)和CUDA

英伟达(NVIDIA)是一家知名的图形处理器(GPU)制造公司,而CUDA则是NVIDIA推出的一种并行计算架构和编程模型。CUDA全称为Compute Unified Device Architecture,即计算统一设备架构,它允许开发者使…

【微服安全】OpenID Connect 简介:现代应用程序的身份验证

OpenID Connect (OIDC) 是一个建立在 OAuth 2.0 之上的开放身份验证协议。它简化了应用程序以一种标准化和可互操作的方式验证用户身份并获取其基本个人资料信息的方式。可以将其视为应用程序“知道你是谁”的一种安全方式,而无需你创建单独的帐户或透露你的密码。 …