hub

CodeZen

CodeZen

一个专注中文区的 GitHub 项目发现

avatar

banana-slides

一个基于nano banana pro🍌的原生AI PPT生成应用,迈向真正的"Vibe PPT"; 支持上传任意模板图片;上传任意素材&智能解析;一句话/大纲/页面描述自动生成PPT;口头修改指定区域、一键导出 - An AI-native PPT generator based on nano banana pro🍌

ai-ppt-maker ai-slide-builder ai-slides llm nanobananapro
star6.8k
Python
avatar

huggingface_hub

该项目是 Hugging Face 平台官方开源的 Python 客户端,提供了模型、数据集和 Spaces 的下载、上传、管理等功能。

deep-learning hacktoberfest machine-learning model-hub models
star3.2k
Python
avatar

PasteMD

一键将 Markdown 和网页 AI 对话(ChatGPT/DeepSeek等)完美粘贴到 Word、WPS 和 Excel 的效率工具 | One-click paste Markdown and AI responses (ChatGPT/DeepSeek) into Word, WPS, and Excel perfectly.

ai chatgpt clipboard converter deepseek
star2.2k
Python
avatar

Fun-Audio-Chat

Fun-Audio-Chat English | 中文 **Fun-Audio-Chat** 是一个专为自然、低延迟语音交互打造的大型音频语言模型。 --- 📋 目录 - 概述overview - 最新动态news - 安装installation - 快速开始quick-start - 评测evaluation - 训练training - 致谢acknowledgments - 许可证license - 联系我们contact --- 📖 概述 **Fun-Audio-Chat** 是一个专为自然、低延迟语音交互打造的大型音频语言模型。它引入了

star123
Python
avatar

Qwen-Image-Layered

&nbsp&nbsp🤗 HuggingFace&nbsp&nbsp | &nbsp&nbsp🤖 ModelScope&nbsp&nbsp | &nbsp&nbsp 📑 Research Paper &nbsp&nbsp | &nbsp&nbsp 📑 Blog &nbsp&nbsp | &nbsp&nbsp 🤗 Demo &nbsp&nbsp Introduction We are excited to introduce **Qwen-Image-Layered**, a model capable of decomposing an image into multipl

star109
Python
avatar

vibe-coding-cn

Vibe Coding 是一个与 AI 结对编程的终极工作流程,旨在帮助开发者丝滑地将想法变为现实。本指南详细介绍了从项目构思、技术选型、实施规划到具体开发、调试和扩展的全过程,强调以规划驱动和模块化为核心,避免让 AI 失控导致项目混乱。

star185
Python
avatar

lanhu-mcp

⚡ 需求分析效率提升 200%!首个为 AI 编程时代设计的团队协作 MCP 服务器,自动分析需求自动编写前后端代码,下载切图

star113
Python
avatar

fin-agent

Fin-Agent 是一个基于 DeepSeek 等大模型和 Tushare 金融数据的智能金融分析代理。它能够通过自然语言交互,帮助用户查询股票行情、分析财务数据、获取市场指标、选股筛选以及策略回测,并提供投资参考建议。

star101
Python
avatar

HY-WorldPlay

实时、几何一致的交互式世界建模系统框架

3d hunyuan hunyuan-world hunyuan3d image-to-3d
star152
Python
avatar

AutoGLM-GUI

AutoGLM 的现代化 Web 图形界面 - 让 AI 自动化操作 Android 设备变得简单

star105
Python
avatar

Fun-ASR

Fun-ASR 是通义实验室推出的端到端语音识别大模型,是基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性,支持低延迟实时听写,并且覆盖 31 个语种。在教育、金融等垂直领域表现出色,能准确识别专业术语与行业表达,有效应对"幻觉"生成和语种混淆等挑战,实现"听得清、懂其意、写得准"。

audio audio-language-model audio-understanding fun-asr multimodal-large-language-models
star108
Python
avatar

ppllocr

用于识别图形验证码的轻量级 OCR 库。目标上对标 Ddddocr,部分情况性能与准确度碾压 Ddddocr。

star101
Python