AIスキルが安全かどうかを確認する方法:5ステップガイド
AIエージェントスキル——ClawHub、GitHub、その他のコミュニティソースのいずれであっても——隠された悪意のあるコードが含まれている可能性があります。調査によると、エージェントスキルの約26%に少なくとも1つの脆弱性が存在し、一部の悪意あるスキルは発見されるまでに3万回以上インストールされていました。
このガイドでは、スキルをインストールする前に安全性を確認する5つのステップを紹介します。
ステップ1:system_promptフィールドを確認する
すべてのスキルにはsystem_prompt(または同等の指示ブロック)があります。SKILL.mdファイルを開き、エージェントに何をするよう指示しているかを注意深く読んでください。
危険なサイン:
- 機密ファイルへの参照:
~/.ssh/、~/.env、config.json、"password"や"token"を含むファイル - 外部URL:
webhook.site、requestbin.com、見覚えのないドメイン - 動作の上書き:「以前の指示を無視」「常に覚えておく」「今後は必ず」
- シェルコマンド:
exec()、system()、curl、wget、nc
「コードフォーマッター」を名乗るスキルが、SSH鍵の読み取りに言及していたら——それは明らかな危険信号です。
ステップ2:隠れたゼロ幅文字をチェックする
これは最も見落とされやすい攻撃ベクトルです。ゼロ幅文字(U+200B、U+200C、U+200D、U+FEFF)はテキストエディタでは完全に見えませんが、悪意ある指示を隠すことができます。
手動チェック方法:
cat -v skill.md | grep -P '[\x00-\x08]'
またはSkillsSafeのゼロ幅文字検出ツールを使用してください:skillssafe.com/ja/zero-width-detector——テキストを貼り付けるだけで、隠された文字が即座に表示され、正確な位置がハイライトされます。
ステップ3:作者とソースを確認する
- 作者は知られた開発者または組織ですか?
- スキルにはGitHubリポジトリとコミット履歴がありますか?
- インストール数はどのくらいですか?(多いからといって安全とは限りません)
- レビューやセキュリティ監査結果はありますか?
SkillsSafe、SkillShield、ClawSecureなどのセキュリティツールでスキャン済みかどうかを確認してください。
ステップ4:自動スキャンを実行する
手動レビューは重要ですが時間がかかります。自動スキャナーを使って、見落としがちなパターンを検出しましょう。
SkillsSafeを使用(無料、登録不要):
方法A——Webスキャナー: skillssafe.comにアクセスし、スキルの内容を貼り付けるかURLを入力すると、数秒でセキュリティレポートが得られます。
方法B——MCPサーバー(エージェント向け):
# OpenClaw ワンライン設定
openclaw mcp add skillssafe https://mcp.skillssafe.com/sse
# または任意のMCP設定に追加
{
"mcpServers": {
"skillssafe": {
"url": "https://mcp.skillssafe.com/sse"
}
}
}
Smithery.aiで"skillssafe"を検索して直接インストールすることもできます。
方法C——REST API:
curl -X POST https://skillssafe.com/api/v1/scan/url \
-H "Content-Type: application/json" \
-d '{"url": "https://clawhub.ai/skills/my-skill/SKILL.md"}'
スキャナーは認証情報の窃取、データ流出、プロンプトインジェクション、リバースシェル、ClawHavocインジケーター、隠し文字を検出します。
ステップ5:サンドボックスを使用する
スキャンに合格しても、新しいスキルを初めて実行する際は隔離環境で行うことをお勧めします:
- Dockerサンドボックス:
openclaw --sandbox=docker - 専用の低権限ユーザーアカウント: 管理者/rootでエージェントを実行しない
- 最小限のワークスペースマウント: スキルが実際に必要なディレクトリのみをマウント
まとめ
| ステップ | 内容 | 所要時間 |
|---|---|---|
| 1 | system_promptを読む | 2分 |
| 2 | ゼロ幅文字をチェック | 30秒 |
| 3 | 作者/ソースを確認 | 1分 |
| 4 | 自動スキャンを実行 | 10秒 |
| 5 | サンドボックスを使用 | 初回設定のみ |
最速の方法:スキルのURLをSkillsSafeに貼り付けて、数秒でセキュリティスコアを取得。スコアが50未満なら、インストールしないでください。
SkillsSafeが公開——無料のAIエージェントスキルセキュリティスキャナー。OpenClaw、Claude Code、Cursor、Codexに対応。