如何讓程序更健壯「GitHub 熱點速覽」

語言: CN / TW / HK

對於 ML 模型訓練而言,好的數據集能讓結果更健壯,cleanlab 是一個降低數據噪音,及時幫你修正數據集錯誤的工具。好的工具能讓你的結果更完美。同樣的,RedTeam-Tools 提高了滲透測試的能力,也間接地讓你的安全系統更牢固。DocsGPT 一看便知它是個 Docs + GPT 的結合體,可以提高文檔解決用户問題的能力。meilisearch 輕量、速度的檢索能力,則提高了 HG 社區的搜索能力。

以下內容摘錄自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 熱帖(簡稱 HN 熱帖),選項標準:新發布 | 實用 | 有趣,根據項目 release 時間分類,發佈時間不超過 14 day 的項目會標註 New,無該標誌則説明項目 release 超過半月。由於本文篇幅有限,還有部分項目未能在本文展示,望周知 🌝

  • 本文目錄
    • 1. 本週特推
      • 1.1 數據集質保:cleanlab
      • 1.2 動畫生成器:motion-canvas
    • 2. GitHub Trending 周榜
      • 2.1 文檔助手:DocsGPT
      • 2.2 再現塞爾達 3:zelda3
      • 2.3 滲透工具:RedTeam-Tools
      • 2.4 低代碼框架:ToolJet
      • 2.5 輕量級搜索引擎:meilisearch
    • 3. 往期回顧

1. 本週特推

1.1 數據集質保:cleanlab

主語言:Python

數據集是每個數據工程師都會經手的東西,那麼如果這個數據集本身有問題,很多噪音,後續的模型訓練結果就不會多好。而 cleanlab 就能幫你檢測 ML 數據集是否有問題,修正裏面有問題的 label 以及標記錯誤的數據。它適用於 Sklearn / PyTorch / TensorFlow / XGBoost 等等框架,一行代碼就能找到任意數據集中的數據和標籤錯誤,像這樣:

label_issues = cl.find_label_issues(data, labels)

而這行代碼能幫你降低數據的噪音,讓訓練出來的模型更健壯:

cl.fit(data, labels)

GitHub 地址→http://github.com/cleanlab/cleanlab

1.2 動畫生成器:motion-canvas

主語言:TypeScript

Motion Canvas 提供了兩樣東西:

  • 一個用於生成編程動畫的 TS 庫;
  • 該編程動畫的實時預覽;

簡單來説,它能創建矢量動畫,並與旁白同步。在線體驗:http://motion-canvas.github.io/editor/quickstart/

GitHub 地址→http://github.com/motion-canvas/motion-canvas

2. GitHub Trending 周榜

2.1 文檔助手:DocsGPT

本週 star 增長數:1,450+主語言:Python、HTML

New 這周 ChatGPT 又燒起來了,這把搞點實際的,這是一個藉助 GPT 模型幫助那些向文檔提問、檢索的人快速得到準確、全面的答案。

GitHub 地址→http://github.com/arc53/DocsGPT

2.2 再現塞爾達 3:zelda3

本週 star 增長數:750+主語言:C

塞爾達·眾神的三角力量的逆向工程,它用了 7-8 萬行 C 代碼來重現經典遊戲,你可以從頭玩到通關。

GitHub 地址→http://github.com/snesrev/zelda3

2.3 滲透工具:RedTeam-Tools

本週 star 增長數:450+

New RedTeam-Tools 供 Red Team 使用的 120+ 技巧和工具,來提高滲透團隊的技術實力。下圖為其中一個工具的截圖:

GitHub 地址→http://github.com/A-poc/RedTeam-Tools

2.4 低代碼框架:ToolJet

本週 star 增長數:1,800+主語言:JavaScript、TypeScript

一個低代碼框架,可在幾分鐘內快速構建、部署內部工具。你可以連接到數據庫,比如:PostgreSQL、MongoDB、ES 等等;也支持 API 端點(支持導入 OpenAPI spec 和 OAuth2 authorization),也支持對接 SaaS 工具,像 Slack、Notion、Google Sheets 之類的都可以接上,還支持對象存儲服務。

GitHub 地址→http://github.com/ToolJet/ToolJet

2.5 輕量級搜索引擎:meilisearch

本週 star 增長數:850+主語言:Rust

一個輕量、快捷的搜索引擎,非常適合在應用程序、網站、workflow 中使用。開箱即用,能在非常短時間內給你檢索結果。大家也可以再重温 1 年半前滷蛋寫的 「相見恨晚!開源的傻瓜搜索引擎,幫你快速實現搜索功能」

GitHub 地址→http://github.com/meilisearch/meilisearch

3. 往期回顧

往期回顧:

以上為 2023 年第 6 個工作周的 GitHub Trending 🎉如果你 Pick 其他好玩、實用的 GitHub 項目,來 HelloGitHub 和大家一起分享下喲 🌝