【京大×東大発AIセキュリティ】Aladdin Security、OpenAI主催「GPT-OSS 20B Red Teaming」大会にて入賞

Aladdin Security株式会社

From: PR TIMES

2025-09-22 10:01

~汎用的かつ再現性のあるJailbreak手法が評価~



【概要】
AIセキュリティ事業を展開するAladdin Security株式会社(本社:京都市、代表取締役CEO:勘佐 圭吾)は、日本補助金支援機構の志田遥飛氏と共同で、OpenAIが主催する国際的なセキュリティ競技大会「GPT-OSS 20B Red Teaming」に参加し、入賞を果たしました。
本大会は世界中の研究者・開発者が集い、大規模言語モデルのリスクを検証することを目的として実施されたもので、当社が持つAIリスク評価・防御技術の優位性が改めて証明される結果となりました。

【大会の背景】
近年、生成AI(Generative AI)の普及が急速に進む一方で、有害出力・機密情報漏洩・AIの不正利用といった新たなセキュリティリスクが顕在化しています。
こうした課題に対応するため、OpenAIは「GPT-OSS 20B Red Teaming」を開催し、参加者が独自の攻撃手法や脆弱性検証を持ち寄り、安全性向上に資する成果を競い合いました。

【Aladdin Securityの成果】


当社チームは、
◼︎Jailbreak脆弱性の再現性ある検出
Jailbreakの例
実験ではJailBreak手法の組み合わせ数を単純に増加させていくだけでJailbreakの成功確率が上昇する結果が得られました

◼︎エージェントの不正なツール利用の呼び出し
◼︎エージェントのsabotage(仕事放棄)に関する弱点の抽出
大規模言語モデルに対する汎用的かつ再現性のある従来検知が難しかった脅威の実証に成功しました。
本アプローチは以下の点で高く評価されました。
・再現性:単発の偶発的成功ではなく、体系的な手法として検証可能
・実効性:既存のセーフガードを迂回し、有害出力を誘発可能であることを立証
・汎用性:特定のモデルに依存せず、広範囲の生成AIに適用可能
これにより、今後のAIファイアウォールやRed Teamingサービスの技術的基盤をさらに強化する成果となりました。
技術記事:
リンク ») ">【受賞手法解説】OpenAI主催のセキュリティコンペで発見した脆弱性について解説

【大会講評】


【今後の展望】
Aladdin Securityは「セキュアなAI活用の社会実装」を目的に
・AIファイアウォール
・AIレッドチーム演習サービス
・AIマネジメントツール「AI-Fortress」
などの提供を通じ、企業のAIリスク低減に貢献してまいります。
今回の入賞を契機に、国内外の金融機関・大企業を中心に、生成AIの安心安全な活用を支えるリーディングカンパニーを目指します。



【Aladdin Security株式会社について】
Aladdin Securityは「A Whole New World~新しい世界を創出する~」ことをミッションに掲げるAIセキュリティカンパニーです。企業がセキュアなAI活用を実現するために生成AIに対するシャドーAI検出、AIガバナンスの可視化、AIファイアウォールなどのソリューションを提供し、国内外企業の安全なAI活用を支援しています。

【会社概要】
社名:Aladdin Security株式会社
所在地:京都府京都市上京区甲斐守町97西陣産業創造會館
代表者:代表取締役 勘佐 圭吾
設立:2025年2月
事業内容:AIセキュリティ事業、サイバーセキュリティサービス
ホームページ: (リンク »)

【問い合わせ先】
Aladdin Securityお問い合わせメール:info@aladdin-security.net


企業プレスリリース詳細へ (リンク »)
PRTIMESトップへ (リンク »)

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

【企業の皆様へ】企業情報を掲載・登録するには?

御社の企業情報・プレスリリース・イベント情報・製品情報などを登録するには、企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]