CodeZen
一个专注中文区的 GitHub 项目发现
所有语言
C
C#
C++
CSS
Dart
Go
HTML
Java
JavaScript
Jupyter Notebook
Kotlin
Lua
PHP
PowerShell
Python
Ruby
Rust
Shell
Swift
TypeScript
Vue
HY-WorldPlay
实时、几何一致的交互式世界建模系统框架
AutoGLM-GUI
AutoGLM 的现代化 Web 图形界面 - 让 AI 自动化操作 Android 设备变得简单
Fun-ASR
Fun-ASR 是通义实验室推出的端到端语音识别大模型,是基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性,支持低延迟实时听写,并且覆盖 31 个语种。在教育、金融等垂直领域表现出色,能准确识别专业术语与行业表达,有效应对"幻觉"生成和语种混淆等挑战,实现"听得清、懂其意、写得准"。
ppllocr
用于识别图形验证码的轻量级 OCR 库。目标上对标 Ddddocr,部分情况性能与准确度碾压 Ddddocr。
clash-ip-checker
🤖Automated node IP risk checking and tagging tool for Clash (适用于 Clash 代理的自动化节点 IP 风险检查并重命名标记工具)
ppt-master
PPT Master 是一个基于多角色 AI 工作流的 SVG 视觉内容生成框架,用来把源文档自动转化为高质量、多终端适配的演示和营销视觉稿(PPT、小红书、朋友圈、Story 等),并配套完整的模板与 Python 工具链。下面的链接为示例的ppt,大家可以看看效果。
OCRPDF-TO-PPT
AI PPT Restorer | AI生成PPT图片还原工具 **将AI生成的精美PPT图片还原为可编辑的PPT文档** Englishenglish | 中文文档chinese --- 📖 项目简介 使用Google Nano Banana Pro等AI工具生成的PPT虽然视觉效果惊艳,但输出的是**不可编辑的图片格式**。当需要修改文字内容时,只能重新生成,极其不便。 参考视频: https://www.bilibili.com/video/BV1a7mJBbEht/?vd_source=32d1e5983d8d2a40a44db0d2e38f9ab4 *
MaaMCP
基于 MaaFramework 的 MCP 服务器 为 AI 助手提供 Android 设备和 Windows 桌面自动化能力
QQgroup-annual-report-analyzer
一个用于分析QQ群聊记录并生成年度热词报告的工具。支持热词发现、趣味统计、可视化报告生成等功能。
GLM-TTS
GLM-TTS是一个基于大型语言模型的高质量文本到语音(TTS)合成系统,支持零样本语音克隆和流式推理。本系统采用两个阶段架构:首先使用LLM生成语音令牌序列,然后使用流模型将令牌转换为高质量的音频格式。通过引入多奖励强化学习(Multi-Reward RL)框架,GLM-TTS能够生成更加丰富的情感表达力和流式推理,显着提升了传统TTS系统的表现力。
visionary
Visionary:面向下一代"大世界模型"的web渲染引擎
GLM-ASR
GLM-ASR Readme in EnglishREADME.md 👋 加入我们的 微信 社区 模型介绍 **GLM-ASR-Nano-2512** 是一款鲁棒的开源语音识别模型,参数量为 **1.5B**。 该模型专为应对真实世界的复杂场景而设计,在多项基准测试中超越 OpenAI Whisper V3,同时保持紧凑的模型规模。 核心能力包括: * **卓越的方言支持** 除标准普通话和英语外,模型针对**粤语**及其他方言进行了深度优化,有效填补了方言语音识别领域的空白。 * **低音量语音鲁棒性** 专门针对**"低语/轻声"**场景进行训练,能