2023 年有什么流行的开源项目?

news/2024/7/10 20:52:02 标签: 开源, AI作画, 人工智能, aigc, ai视频, midjourney, AI

背景介绍

作为一个资深开源参与者,我盘点下2023年有意思的开源项目,从GitHub热榜角度盘点下。

作为工程师我对技术理解顺势而为,当风口袭来拥抱研究使用,理解其中精髓为风口添砖加瓦。

2023年很特殊,AI生成开始火热起来,大部分上热榜的都跟AI相关。

AILLMsGenAI_9">AI生成(LLMs和GenAI

2023年对于LLMs和GenAI来说是重要的一年,OpenAI的ChatGPT和GPT-4.0引领了这一趋势。

这些模型在规模和能力上树立了新标准,为LLMs的广泛应用奠定了基础。

OpenAI发布的GPTs和用户自定义ChatGPT的能力进一步展示了它们在该领域的领先地位。

https://openai.com/research/gpt-4

模型名称机构地址描述许可
GPT-4openAIhttps://chat.openai.com/GPT-4是OpenAI在2023年1月发布的最新语言模型闭源
文心一言百度https://yiyan.baidu.com/作为你的智能伙伴,我既能写文案、想点子,又能陪你聊天、答疑解惑。闭源
通义千问/qwen-7b阿里巴巴https://tongyi.aliyun.com/qianwen/通义千问是由阿里巴巴集团旗下的云端运算服务的科技公司阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。开源
AndesGPTOPPOhttps://wccftech.com/oppo-unveils-andesgpt-debuting-first-on-the-find-x7-series-next-year/OPPO声称将带来很多AI能力。它还将能够利用诸如交换注意力之类的功能,并且它实际上将解决诸如第一个单词推理之类的问题,这通常是在这些模型中引起的。闭源
智谱清言/chatglm清华 & 智谱https://chatglm.cn/开源双语对话语言模型开源
Moonshot (KimiChat)月之暗面https://kimi.moonshot.cn/语言模型,文字和API调用闭源
序列猴子出门问问https://openapi.moyin.com/index语言驱动的深度学习大模型能够快速、准确地处理语言表达,支持多种交互方式,可以快速生成悦耳的语音、高质量的文本,以及与人机进行互动,以满足各种语音、文本和对话需求。闭源
Yi-34B-Chat零一万物https://huggingface.co/01-ai/Yi-34B-ChatYi 系列模型以双语语言模型为目标,在 3T 多语言语料库上进行训练,成为全球最强的 LLM 模型之一,在语言理解、常识推理、阅读理解等方面表现出良好的前景开源
PCI-TransGPT佳都科技https://github.com/PCIResearch/TransCore-M自主研发的中英文双语翻译预训练语言模型开源
360GPT_Pro360http://gpt.360.cn/360 版 GPT 已经具备了一定的推理能力,但在回答具体问题时多次“翻车”,不少问题需要多次回答才能给出准确答复。闭源
Claude2Anthropichttps://www.anthropic.com/index/claude-2语言模型,擅长写作,市面上最长的上下文,支持高达100k令牌闭源
云雀大模型(豆包)字节跳动https://www.volcengine.com/product/yunque云雀是一款由字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效的完成互动对话、信息获取、协助创作等任务闭源
Gemini-proGooglehttps://deepmind.google/technologies/gemini/Gemini,这是我们最大、功能最强大的人工智能模型,也是我们让人工智能为每个人提供更多帮助的旅程的下一步。它有三种尺寸:Ultra、Pro 和 Nano。我们已经开始在我们的产品中推出 Gemini:从Pixel 8 Pro开始, Gemini Nano 出现在Android中,而专门调整的 Gemini Pro 版本则出现在Bard中。闭源
baichuan-13b-chat百川智能https://huggingface.co/baichuan-inc/Baichuan-13B-ChatBaichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。开源
xverse-13b-2-chat元象科技https://huggingface.co/xverse/XVERSE-13B-Chat相较于原始版本,新版本的模型训练更加充分(从 1.4T 增加到 3.2T),各方面的能力均得到大幅提升,同时新增工具调用能力开源
讯飞星火v3.0科大讯飞https://passport.xfyun.cn/login拥有跨领域的知识和语言理解能力,完成问答对话和文学创作等任务。持续从海量文本数据和大规模语法知识中学习进化,实现从提出问题、规划问题到解决问题的全流程闭环闭源
minimax(应事)稀宇科技https://yingshi-ai.com/?utm_source=ai-bot.cn&ref=cnainav.com应事AI是基于MiniMax最新一代中文大语言模型的AI聊天机器人,产品前身是Inspo,现已通过备案并向社会开放。闭源
chinese-alpaca-2-13byiming cuihttps://huggingface.co/hfl/chinese-alpaca-2-13b一个包含130亿参数的中文语言模型,基于Meta发布的Llama-2进行扩展和优化开源
llama-2-13b-chatMetahttps://huggingface.co/meta-llama/Llama-2-13b-chat-hfLlama 2 是一组经过预训练和微调的生成文本模型,参数规模从 70 亿到 700 亿不等。开源
StableLMStabilityhttps://github.com/Stability-AI/StableLMStableLM 系列语言模型开源
ChatYuanClueAIhttps://github.com/clue-ai/ChatYuanChatYuan-large-v2是一个支持中英双语的功能型对话语言大模型。ChatYuan-large-v2使用了和 v1版本相同的技术方案,在微调数据、人类反馈强化学习、思维链等方面进行了优化。开源
colossalaiColossal-AIhttps://colossalai.org/Colossal-AI: 让AI大模型更低成本、方便易用、高效扩展开源
colossalaiColossal-AIhttps://colossalai.org/Colossal-AI: 让AI大模型更低成本、方便易用、高效扩展开源
BLOOMbigsciencehttps://huggingface.co/bigscience/bloomBLOOM 是一种自回归大型语言模型 (LLM),经过训练,可使用工业规模的计算资源根据大量文本数据的提示继续文本。开源
Falcontiiuaehttps://huggingface.co/tiiuae/falcon-180BFalcon-180B 是由TII构建的 180B 参数因果解码器模型,并在使用精选语料库增强的RefinedWeb的 3,500B 令牌上进行训练。开源
AquilaBAAIhttps://huggingface.co/BAAI/Aquila2-70B-Expr我们开源了我们的 Aquila2 系列,现在包括基础语言模型 Aquila2-7B,Aquila2-34B 和 Aquila2-70B-Expr ,对话模型 AquilaChat2-7B,AquilaChat2-34B 和AquilaChat2-70B-Expr ,长文本对话模型AquilaChat2-7B-16k 和 AquilaChat2-34B-16k开源

AI_47">AI绘画

AI绘画Midjourney一年时间登顶独角兽,让大家看到这个领域巨大潜力。

模型名称机构地址描述许可
MidjourneyMidjourneyhttps://www.midjourney.com/homeMidjourney是一个由位于美国加州旧金山的同名研究实验室开发之人工智能程序,可根据文本生成图像,于2022年7月12日进入公开测试阶段,用户可透过Discord的机器人指令进行操作。闭源
DALL·E 3openaihttps://openai.com/OpenAI 开发的先进 AI 系统,可以通过文本描述生成高质量图像。闭源
DreamStudiostabilityhttps://beta.dreamstudio.ai/Stable Diffusion的在线图形界面,易于上手使用。提供免费和收费版本。闭源
Disco DiffusionSomnai_dreamshttps://github.com/alembics/disco-diffusion这是一款基于文本的AI绘画工具,它能够根据用户提供的文字描述,生成具有艺术感的图片。Disco Diffusion使用了GAN和Diffusion的技术,能够生成高质量的图像,并且支持多种不同的艺术风格和工具。闭源
artflowNeuralBay Inc多种 AI 生成能力,致力于提供数字创意工具的在线平台闭源
FireflyAdobehttps://www.adobe.com/products/firefly.html使用生成式人工智能和简单的文本提示来创建最高质量的输出 - 美丽的图像、文本效果和新鲜的调色板。从参考图像中制作全新内容并更快地探索更多可能性。闭源
Imagegooglehttps://imagen.research.google/Imagen,一种文本到图像的扩散模型闭源
Stable Diffusionstabilityhttps://huggingface.co/spaces/stabilityai/stable-diffusionAI绘画工具开源
文心一格百度https://yige.baidu.com/AI绘画工具闭源
Tiamat 2tiamathttps://www.tiamat.com/AI绘画工具 。闭源
xunjieshipin迅捷https://www.xunjieshipin.com/一键AI绘画是一款将文字描述通过AI智能一键生成为图像画面的图片软件,根据不同的文字描述可以生成风格迥异的图片内容,并且附带了智能抠图、老照片修复和图片编辑助手等实用功能。闭源
无界版图杭州超节点信息科技https://www.wujiebantu.com/无界版图是杭州超节点信息科技有限公司创立的数字版权在线拍卖平台,依托区块链技术在资产确权、拍卖⽅⾯的优势,全面整合全球优质艺术资源,致力于为艺术家、创作者提供数字作品的版权登记、保护、使⽤与拍卖等⼀整套解决⽅案,同时也是新媒体、设计、⼴告、各类垂直⾏业及个⼈⽤户购买诸如摄影、插画、纯艺术、数字艺术的聚集地。闭源
即时 AI即时https://jsai.cc/aiAI绘画工具闭源
PAI AI 绘画PAI AIhttps://artpai.xyz/?ref=openi.cnPAI是一个AI绘画生成网站闭源
YUAN 初AI中国(aicn.me)https://www.aicn.me/sites/2299.htmlAI绘画生成网站闭源
意间 AI 绘画创意云一个AI绘画小程序意间AI绘画创意云是一个AI绘画小程序,无须下载在线绘画,直接在微信上就可以作画!闭源
盗梦师 Printidea西湖心辰https://printidea.art/「盗梦师」是西湖心辰(杭州)科技有限公司和西湖大学深度学习实验室共同推出的一款AI绘画平台。闭源
KK 画廊kk 图画http://kk89.com/ap/ap.htmKK 画廊闭源
DraftDrafthttps://draft.art/exploredraft.art是一款免费的ai绘画生成器,素材丰富功能便捷,很适合新手使用。同时draft.art还有大量的优秀独立创作者分享作品,是一个人气极高的ai绘画网站。闭源
SolidUISolidUIhttps://github.com/CloudOrc/SolidUI数据图表生成模型开源

Midjourney v6
Midjourney v6
Dall-e 3
Dall-e 3
SDXL
SDXL

AI_81">AI视频

AI生成视频工具是一种利用人工智能技术来创建或编辑视频的软件。

一开始Runway 引发的热度,Runway 3个创始人之中有Stable Diffusion论文参与者。

Runway ML

MidJourney + Runway

https://runwayml.com/

描述:Runway ML提供了一个易于使用的界面,让用户可以利用最新的机器学习模型来编辑视频。它支持各种功能,如对象识别、风格转换和内容生成。
适用场景:艺术创作、视频编辑、视觉效果等。

Pika

AI Pika生成进击巨人

https://pika.art/launch

一个视频创作平台,旨在通过其先进的AI技术简化高质量视频的制作过程。

stable-video-diffusion

https://stability.ai/news/stable-video-diffusion-open-ai-video-model

Stability AI基于其图像生成模型Stable Diffusion开发的第一个开源视频生成模型。

Genmo AI

https://www.ainav.cn/go/?url=aHR0cHM6Ly93d3cuZ2VubW8uYWkv

使用Genmo AI,您的创意副驾驶,制作视频、3D模型、图像、艺术等

Animatediff Web Online

AnimateDiff.org:免费,简单的人工智能文本到视频转换
https://www.animatediff.org/

AI_132">AI编程

AI生成编程是指使用人工智能技术自动编写或辅助编写代码的过程。这种技术通常依赖于机器学习模型,特别是大型语言模型,来理解编程语言的语法和逻辑,并生成有效的代码片段。

GitHub Copilot

由GitHub和OpenAI共同开发,Copilot是一个代码自动完成工具,可以在多种编程语言中生成代码片段和整个函数。

通义灵码

https://tongyi.aliyun.com/lingma
灵动指间,快码加编,你的智能编码助手

CodeGeeX

https://github.com/THUDM/CodeGeeX

开源项目

这是一个大规模的多语言代码生成预训练模型,包含130亿参数。
它支持多种编程语言的代码生成,包括Python、C++、Java、JavaScript、Go等。

AI_153">AI语音

AI生成语音,也被称为文本到语音(Text-to-Speech, TTS)技术,是一种利用人工智能算法将文本信息转换为听起来像人声的语音的技术。这项技术在近年来得到了显著的发展,尤其是在自然语音生成和语音的真实感方面。

Google Cloud Text-to-Speech

Google的这项服务提供了广泛的语言和声音选择,支持多种不同的语言和口音。它使用深度学习技术生成自然听起来的语音,并提供了简单的API接口。

Whisper

https://openai.com/research/whisper

Whisper 的神经网络,它在英语语音识别方面的鲁棒性和准确性接近人类水平。

LLMOps

LLMOps 平台专注于提供大模型的部署、 运维和优化服务, 旨在帮助企业和开发者更高效地管理和使用这些先进的 AI 模型,快速完成从模型到应用的跨越。
在这里插入图片描述

LangChain

https://github.com/langchain-ai/langchain

LangChain 是一个开源项目,由 Harrison Chase 领导,旨在促进和简化大型语言模型(LLM)的集成和应用。LangChain 的核心理念是通过链式交互,使多个 LLM 模型能够串联工作,发挥各自的优势,并与外部数据源连接,从而产生更强大的语言理解和生成效果。

Dify.AI

https://github.com/langgenius/dify

Dify 是一个 LLM 应用开发平台,已经有超过 10 万个应用基于 Dify.AI 构建。它融合了 Backend as Service 和 LLMOps 的理念,涵盖了构建生成式 AI 原生应用所需的核心技术栈,包括一个内置 RAG 引擎。使用 Dify,你可以基于任何模型自部署类似 Assistants API 和 GPTs 的能力。

LLMAgent

LLM Agent 是一种基于 LLM 的智能代理, 它能够自主学习和执行任务,具有一定的“ 认知能力和决策能力 ” 。 LLM Agent 的出现, 标志着
LLM 从传统的模型训练和应用模式, 转向以 Agent 为中心的智能化模
式。

AutoGPT

https://github.com/Significant-Gravitas/AutoGPT

它使用的是 OpenAI 的 GPT-4 或GPT-3.5 API, 是首个使用 GPT-4 执行自主任务的应用程序实例 。

AutoGPT 最大的特点在于能根据任务指令自主分析和执行,当 收到一个需求或任务时, 它会开始分析这个问题, 并且给出执行目标和具体任务, 然后开始执行。

总结

2023年比较著名的开源项目和闭源项目都介绍,后续朋友指出补充,我再继续汇总。

我是dlimeng,独立开源软件开发者,SolidUI作者,对于新技术非常感兴趣,专注AI和数据领域,如果对我的文章内容感兴趣,请帮忙关注点赞收藏,谢谢!


http://www.niftyadmin.cn/n/5293474.html

相关文章

线上问题复盘记录

cust_id误刷问题 问题原因:错误的update语句,导致本来更新一条数据的, 结果更新了全表 解决措施:找DBA从备份库,将生产库cust_id为0的数据,恢复到误刷前一秒的cust_id 后续改进: 禁止以任意…

第五章 Vim 文本编辑器

第五章 Vim 文本编辑器 1、Vim 使用模式介绍2、普通模式3、编辑模式4、命令行模式5、可视操作6、剪贴板操作7、多文件操作1)vim 文件 1 文件 2 文件 3...2)vim -o 文件 1 文件 2 文件 3... 上下分屏显示3)vim -O 文件 1 文件 2 文件 3... 左右…

系列四、Eureka自我保护

一、Eureka自我保护 1.1、故障现象 保护模式主要用于一组客户端和Eureka Server之间存在网络分区场景下的保护。一旦进入保护模式,Eureka Server将会尝试保护其服务注册表中的信息,不再删除服务注册表中的数据,也就是不会注销任何微服务。如…

【开题报告】基于SpringBoot的餐饮店管理系统设计与实现

1.研究背景和目的 餐饮行业是一个庞大而竞争激烈的行业,随着社会的发展和人们生活水平的提高,人们对餐饮服务的需求也越来越高。传统的餐饮业管理方式已经不能满足当今消费者的需求,如何提升餐饮店的管理效率和用户体验成为了摆在餐饮业前的…

windows 安装docker 一直在starting

安装完成后第一次启动会提示是不是要使用推荐配置,选否,使用自定义方式更新wsl,不然就会一直卡的不动,因为自动更新很慢 使用windows终端,用wsl --update命令更新wsl,多执行几次,一直到 然后启…

Efficient Classification of Very Large Images with Tiny Objects(CVPR2022待补)

文章目录 Abstract挑战此前的方法我们提出成果 IntroductionZoom-In NetworkTwo-stage Hierarchical Attention Sampling内存需求 Efficient Contrastive Learning with Attention Sampling Related WorkTiny object classificationAttentionComputational efficiencyIn-sample…

nodejs+vue+ElementUi农产品团购销售系统zto2c

目标是为了完成小区团购平台的设计和实现,在疫情当下的环境,方便小区业主购入生活所需,减小居民的生活压力 采用B/S模式架构系统,开发简单,只需要连接网络即可登录本系统,不需要安装任何客户端。开发工具采…

Anolis安装Jdk保姆级教学

前言 欢迎来到本博客,我们将带领你完成在Anolis操作系统上安装Java Development Kit(JDK)的详细过程。Anolis操作系统是一款基于Linux的轻量级操作系统,专为容器和云原生应用而设计。在Anolis上安装JDK将为你提供一个稳定、高效的…