トピック: 規制/政策
該当記事 27 件 / 新しい順
LCSHBench: 米国議会図書館件名見出し割り当てのための、多言語で合意に基づいたベンチマーク
自動主題目録作成では、制御された語彙見出しが書誌レコードに割り当てられますが、LCSH には標準の公開ベンチマークがありません。 LCSHBench を紹介します。オープンライセンスのハーバード大学、コロンビア大学、プリンストン大学のカタログから 15 言語で 22,346 冊の本を紹介します。記録は、少なくとも 2 つの独立目録作成機関が LCSH を割り当てた場合にのみ入力されます。私たちはカタログごとの来歴と結合および全員一致の回答ビューをリリースします。 3 つの図書館すべてでカタログ化されている 465,187 作品の一致調査では、なぜこのデザインが重要であるかを示しています。図書館は通常、基礎となるトピックについては一致しています (93.3% が概念レベルの見出しを共有) が、正確な表現が異なることがよくあります (39.4% が同一の見出しセットを持っています)。したがって、LCSHBench は、オープン語彙の生成と完全な語彙の検索にわたって、言語と見出しの種類ごとに分類されたセットとランクのメトリクスを使用して、完全一致と概念一致の両方をスコアリングします。最初のデモンストレーションとして、300M オンデバイス エンベッダーの低ランク微調整により、言語を超えた検索が向上し、開発正確な再現率 @ 200 (0.659 対 0.623) で 3,072 次元のホスト型エンベッダーを上回りました。言語パネルは、ゲインが一様ではないことを示しており、ホールドアウトテストとエンドツーエンドの確認は今後の作業として残っています。
原文 (English)
LCSHBench: A Multilingual, Consensus-Grounded Benchmark for Library of Congress Subject Heading Assignment
Automated subject cataloging assigns controlledvocabulary headings to bibliographic records, but LCSH has no standard public benchmark. We introduce LCSHBench: 22,346 books in 15 languages from the openly licensed Harvard, Columbia, and Princeton catalogs. Records enter only when at least two independent cataloging agencies assigned LCSH; we release per-catalog provenance plus union and unanimous answer views. A concordance study of 465,187 works cataloged by all three libraries shows why this design matters: libraries usually agree on the underlying topic (93.3% share a concept-level heading) but often differ in exact expression (39.4% have identical heading sets). LCSHBench therefore scores both exact and concept matches, with set and rank metrics broken down by language and heading type, across open-vocabulary generation and full-vocabulary retrieval. As a first demonstration, a low-rank fine-tune of a 300M on-device embedder improves cross-lingual retrieval and beats a 3,072-dimensional hosted embedder on development exact recall@200 (0.659 vs 0.623). The language panel shows the gain is not uniform, and held-out-test and end-to-end confirmation remain future work.
LCSHBench: 米国議会図書館件名見出し割り当てのための、多言語で合意に基づいたベンチマーク
自動主題目録作成では、制御された語彙見出しが書誌レコードに割り当てられますが、LCSH には標準の公開ベンチマークがありません。 LCSHBench を紹介します。オープンライセンスのハーバード大学、コロンビア大学、プリンストン大学のカタログから 15 言語で 22,346 冊の本を紹介します。記録は、少なくとも 2 つの独立目録作成機関が LCSH を割り当てた場合にのみ入力されます。私たちはカタログごとの来歴と結合および全員一致の回答ビューをリリースします。 3 つの図書館すべてでカタログ化されている 465,187 作品の一致調査では、なぜこのデザインが重要であるかを示しています。図書館は通常、基礎となるトピックについては一致しています (93.3% が概念レベルの見出しを共有) が、正確な表現が異なることがよくあります (39.4% が同一の見出しセットを持っています)。したがって、LCSHBench は、オープン語彙の生成と完全な語彙の検索にわたって、言語と見出しの種類ごとに分類されたセットとランクのメトリクスを使用して、完全一致と概念一致の両方をスコアリングします。最初のデモンストレーションとして、300M オンデバイス エンベッダーの低ランク微調整により、言語を超えた検索が向上し、開発正確な再現率 @ 200 (0.659 対 0.623) で 3,072 次元のホスト型エンベッダーを上回りました。言語パネルは、ゲインが一様ではないことを示しており、ホールドアウトテストとエンドツーエンドの確認は今後の作業として残っています。
原文 (English)
LCSHBench: A Multilingual, Consensus-Grounded Benchmark for Library of Congress Subject Heading Assignment
Automated subject cataloging assigns controlledvocabulary headings to bibliographic records, but LCSH has no standard public benchmark. We introduce LCSHBench: 22,346 books in 15 languages from the openly licensed Harvard, Columbia, and Princeton catalogs. Records enter only when at least two independent cataloging agencies assigned LCSH; we release per-catalog provenance plus union and unanimous answer views. A concordance study of 465,187 works cataloged by all three libraries shows why this design matters: libraries usually agree on the underlying topic (93.3% share a concept-level heading) but often differ in exact expression (39.4% have identical heading sets). LCSHBench therefore scores both exact and concept matches, with set and rank metrics broken down by language and heading type, across open-vocabulary generation and full-vocabulary retrieval. As a first demonstration, a low-rank fine-tune of a 300M on-device embedder improves cross-lingual retrieval and beats a 3,072-dimensional hosted embedder on development exact recall@200 (0.659 vs 0.623). The language panel shows the gain is not uniform, and held-out-test and end-to-end confirmation remain future work.
「この1年はAI戦国時代」 メルカリに学ぶ、AIガバナンス策定の勘所
生成AIの業務利用が前提となり、AIを通じてビジネス価値をどう生み出すかが問われている一方で、「シャドーAI」をはじめとするリスクも指摘されている。先行企業はAIのリスクをどう受け止め、対策に乗り出しているのか。本稿では「AI-Native Company」への転換を宣言し、A…
LCSHBench: 米国議会図書館件名見出し割り当てのための、多言語で合意に基づいたベンチマーク
自動主題目録作成では、制御された語彙見出しが書誌レコードに割り当てられますが、LCSH には標準の公開ベンチマークがありません。 LCSHBench を紹介します。オープンライセンスのハーバード大学、コロンビア大学、プリンストン大学のカタログから 15 言語で 22,346 冊の本を紹介します。記録は、少なくとも 2 つの独立目録作成機関が LCSH を割り当てた場合にのみ入力されます。私たちはカタログごとの来歴と結合および全員一致の回答ビューをリリースします。 3 つの図書館すべてでカタログ化されている 465,187 作品の一致調査では、なぜこのデザインが重要であるかを示しています。図書館は通常、基礎となるトピックについては一致しています (93.3% が概念レベルの見出しを共有) が、正確な表現が異なることがよくあります (39.4% が同一の見出しセットを持っています)。したがって、LCSHBench は、オープン語彙の生成と完全な語彙の検索にわたって、言語と見出しの種類ごとに分類されたセットとランクのメトリクスを使用して、完全一致と概念一致の両方をスコアリングします。最初のデモンストレーションとして、300M オンデバイス エンベッダーの低ランク微調整により、言語を超えた検索が向上し、開発正確な再現率 @ 200 (0.659 対 0.623) で 3,072 次元のホスト型エンベッダーを上回りました。言語パネルは、ゲインが一様ではないことを示しており、ホールドアウトテストとエンドツーエンドの確認は今後の作業として残っています。
原文 (English)
LCSHBench: A Multilingual, Consensus-Grounded Benchmark for Library of Congress Subject Heading Assignment
Automated subject cataloging assigns controlledvocabulary headings to bibliographic records, but LCSH has no standard public benchmark. We introduce LCSHBench: 22,346 books in 15 languages from the openly licensed Harvard, Columbia, and Princeton catalogs. Records enter only when at least two independent cataloging agencies assigned LCSH; we release per-catalog provenance plus union and unanimous answer views. A concordance study of 465,187 works cataloged by all three libraries shows why this design matters: libraries usually agree on the underlying topic (93.3% share a concept-level heading) but often differ in exact expression (39.4% have identical heading sets). LCSHBench therefore scores both exact and concept matches, with set and rank metrics broken down by language and heading type, across open-vocabulary generation and full-vocabulary retrieval. As a first demonstration, a low-rank fine-tune of a 300M on-device embedder improves cross-lingual retrieval and beats a 3,072-dimensional hosted embedder on development exact recall@200 (0.659 vs 0.623). The language panel shows the gain is not uniform, and held-out-test and end-to-end confirmation remain future work.
日本政府、AI「Mythos」アクセス権を取得 サイバー防衛強化に活用
三菱UFJ銀行、三井住友銀行、みずほ銀行もアクセス権を得たとみられている。
「AI使うな」より「使うなら教えて」 エージェント時代のガバナンス再設計
AIエージェントの業務適用が広がる一方、組織のガバナンスが追いついていない。OWASPの指摘を踏まえ、日本企業が押さえるべき2つの原則と、来週から始められる3つのアクションを解説する。
Reproducibility is the New Copyleft: Defining AGI-oriented Reproducible Builds
Copyleft, as implemented in licenses such as the GNU General Public License, was a legal hack that used copyright to guarantee user freedom…
トランプ米大統領、AI安全保障に関する大統領令に署名 最先端モデルを公開30日前に政府が検査可能に
トランプ米大統領は、先進的AIのイノベーションと安全保障の促進に関する大統領令に署名した。戦争省やCISAによるサイバー防衛強化に加え、主要企業の最先端AIモデルを政府が事前検証する任意の枠組みを構築する。政府は全面的な監視を否定しており、民間の開発自由度を維持しつつ安全保障の…
Amazon faces class action lawsuit over Ring facial-recognition feature
The class action lawsuit, filed in Seattle by Virginia resident Charles Sigwalt, claims that Ring's Familiar Faces feature stores images of…
Trump signs narrower executive order on AI oversight after industry objections
After industry objections, President Trump signed a revised AI executive order requiring only voluntary prerelease government reviews of ad…
How Hard Can It Be? Hardness-Aware Multi-Objective Unlearning
Machine unlearning aims to remove the influence of specific forget training data due to privacy, copyright or bias concerns while maintaini…
Florida sues OpenAI, Sam Altman, in first-of-its-kind lawsuit over violent incidents
The lawsuit partially revolves around a shooting at Florida State University last year, and ChatGPT's alleged role in the incident.
Gap-K%: Measuring Top-1 Prediction Gap for Detecting Pretraining Data
The opacity of massive pretraining corpora in Large Language Models (LLMs) raises significant privacy and copyright concerns, making pretra…
OpenAIが生命科学推論AI「GPT-Rosalind」をバイオディフェンスに開放 デュアルユースリスクに懸念も
OpenAIは、生命科学研究に特化したフロンティア推論モデル「GPT-Rosalind」を活用した「Rosalind Biodefense」プログラムを発表した。生物脅威の検知など防衛目的に限定し、審査済みの開発者や米政府機関および同盟国のパートナー組織にAPIを無償提供する。
日本政府と主要金融機関、OpenAI新モデルのアクセス権を取得 サイバー対策強化へ
片山さつき金融担当相が、米OpenAIが開発した新型AIのアクセス権を政府と主要金融機関が取得したと明らかにした。高性能AIがサイバー攻撃に悪用される懸念が高まる中、AIを防御に活用した対策が急務となっている。片山氏は「わが国金融機関のサイバーセキュリティー強化の観点から歓迎す…
OpenAI、日本政府とサイバーセキュリティで協力 最新AI「GPT-5.5-Cyber」を金融機関に提供
米OpenAIは、日本政府とサイバーセキュリティで協力する取り組み「日本サイバー・アクションプラン」を発表した。まずは、金融機関にサイバーセキュリティに特化した最新AIモデル「GPT-5.5-Cyber」を提供する。
デジタル庁、AI「源内」向け国産LLM再公募 有償の政府調達へ 評価テストは50問→300問に
初回公募は無償試用を前提に募集したが、27年度向け公募では政府調達(有償)に移行する。
GS-FUSE: Granger-Supervised Gated Fusion and Multi-Granularity Alignment for Event-Driven Financial Forecasting
Accurately forecasting the impact of salient financial events on markets is critical for investors and policymakers. However, existing mult…
Black-box Membership Inference Attacks on the Pre-training Data of Image-generation Models
The rapid advancement of diffusion-based image generation models has raised serious concerns regarding potential copyright and privacy infr…
SWAP: Towards Copyright Auditing of Soft Prompts via Sequential Watermarking
Large-scale vision-language models, especially CLIP, have demonstrated remarkable performance across diverse downstream tasks. Soft prompts…
Shadow Unlearning: A Neuro-Semantic Approach to Fidelity-Preserving Faceless Forgetting in LLMs
Machine unlearning aims to selectively remove the influence of specific training samples to satisfy privacy regulations such as the GDPR's…
「AIによる権利侵害」に出版・アニメ制作会社など集う国内団体が声明 「看過できない問題」
出版社やアニメ制作会社などで構成される団体・コンテンツ海外流通促進機構(CODA)は、生成AIによる著作権侵害に関する声明を出した。AIの開発やAIサービスを提供する事業者に対し、権利の保護などを求めている。
松下幸之助氏の「AI偽動画」に注意 PHP研究所が再告知 津田健次郎さんによるTikTok提訴受け
出版・教育事業を手がけるPHP研究所は5月26日、創設者・故松下幸之助氏の画像や音声を無断でAI合成した偽動画が引き続き出回っているとして、公式Xで改めて注意喚起を投稿した。
松下幸之助氏の「AI偽動画」に注意 PHP研究所が再告知 津田健次郎さんによるTikTok提訴受け
出版・教育事業を手がけるPHP研究所は5月26日、創設者・故松下幸之助氏の画像や音声を無断でAI合成した偽動画が引き続き出回っているとして、公式Xで改めて注意喚起を投稿した。
高リスク AI システムと欧州 AI 法におけるアイデンティティの問題
EU 人工知能法 (AIA) は、事前の適合性評価、市販後のモニタリング、および「大幅な変更」時の再評価を中心に構築された高リスク AI システムのライフサイクル ガバナンス体制を確立しています。これらの義務は AI のアイデンティティ判断を前提としています。規制当局とプロバイダーは、更新されたシステムが長期間にわたって同じシステムのままであるかどうかを決定する必要があります。この研究では、このロジックがアーティファクト ID の機能 + フレームワークによってどのように明確化されるかを示します。このフレームワークは、「AI の信頼性」として捉えられる、適切な機能の状況依存の基準とともに、意図された機能によって AI システムを個別化します。さらに我々は、AIAは同期的同一性(規制上の目的で一度に2つのAIシステムが同一とみなされるべき場合)に関する内部の監査可能な基準を提供しておらず、代わりにそのような同一性の判断を分野別または調和化の手段に大きく委ねていると主張する。 function+ は、意図した機能と信頼性のプロファイルとレベルに基づいた同期アイデンティティ テストを提供し、調達、責任、市場監視などのガバナンス設定で同期アイデンティティの決定を検査可能にします。私たちの貢献は概念的なレンズと監査レンズです。私たちは、AIA ライフサイクル義務と機能 + アイデンティティ コンポーネント間の対応マップを提供し、監査と紛争のコンテキストに関する最小限の意思決定フローを通じて同期ケースを運用上判読できるようにします。最後に、実装に向けた 2 つの推奨事項を示します。(1) 意図された目的についての、より正確でテスト可能なレポート。(2) 経時的および導入間での比較可能性をサポートする、標準化された監査可能な信頼性レポート。
原文 (English)
High-Risk AI Systems and the Problem of Identity in the European AI Act
The EU Artificial Intelligence Act (AIA) establishes a lifecycle governance regime for high-risk AI systems built around ex-ante conformity assessment, post-market monitoring, and re-assessment upon "substantial modification." These obligations presuppose AI identity judgments: regulators and providers must decide when an updated system remains the same system over time. In this work, we show how this logic is clarified by the function+ framework of artifact identity, which individuates AI systems by their intended function together with context-sensitive criteria of appropriate functioning, captured as "AI trustworthiness." We further argue that the AIA does not provide an internal, auditable criterion for synchronic identity--when two AI systems at a given time should count as the same for regulatory purposes--and instead largely defers such sameness determinations to sectoral or harmonization instruments. function+ supplies a synchronic identity test anchored in intended function and trustworthiness profiles and levels, making synchronic identity decisions inspectable in governance settings such as procurement, liability, and market surveillance. Our contribution is a conceptual and auditing lens: we provide a correspondence map between AIA lifecycle obligations and function+ identity components, and we make the synchronic case operationally legible via a minimal decision flow for audit and dispute contexts. We conclude with two implementation-facing recommendations: (1) more precise, testable reporting of intended purpose, and (2) standardized, auditable trustworthiness reporting that supports comparability over time and across deployments.
ServiceNow、AIエージェントの「データの空白」を埋める機能群を発表
AIエージェント導入の「壁」になるのが、サイロ化したデータとガバナンスの未整備だ。ServiceNowはこの課題をどう解決しようとしているのか。年次イベントで発表された新機能群を紹介する。
XAttnMark: クロスアテンションによる堅牢なオーディオ透かしの学習
音声生成合成および編集技術の急速な普及により、著作権侵害、データの出所、ディープフェイク音声を介した誤った情報の拡散についての深刻な懸念が生じています。ウォーターマークは、知覚できないが識別可能で追跡可能な信号をオーディオ コンテンツに埋め込むことで、プロアクティブなソリューションを提供します。 WavMark や AudioSeal などの最近のニューラル ネットワーク ベースの透かし手法は堅牢性と品質を向上させていますが、堅牢な検出と正確な属性の両方を最適化するのに苦労しています。このペーパーでは、生成器と検出器の間の部分的なパラメータ共有、効率的なメッセージ取得のためのクロスアテンション メカニズム、およびメッセージ配信を改善するための時間調整モジュールを活用することで、このギャップを埋めるクロスアテンション ロバスト オーディオ ウォーターマーク (XATTNMARK) を紹介します。さらに、きめの細かい聴覚マスキング効果を捕捉し、透かしの知覚不能性を改善する、心理音響的に調整された時間周波数 (TF) マスキング損失を提案します。 XATTNMARK は、検出と属性の両方で最先端のパフォーマンスを実現し、さまざまな強度での困難なジェネレーティブ編集を含む、幅広いオーディオ変換に対する優れた堅牢性を実証します。この取り組みは、知的財産を保護し、生成 AI 時代の信頼性を確保するために音声透かしを進歩させます。
原文 (English)
XAttnMark: Learning Robust Audio Watermarking with Cross-Attention
The rapid proliferation of generative audio synthesis and editing technologies has raised serious concerns about copyright infringement, data provenance, and the spread of misinformation via deepfake audio. Watermarking offers a proactive solution by embedding imperceptible yet identifiable and traceable signals into audio content. While recent neural network-based watermarking methods like WavMark and AudioSeal have improved robustness and quality, they struggle to jointly optimize both robust detection and accurate attribution. This paper introduces Cross-Attention Robust Audio Watermark (XATTNMARK), which bridges this gap by leveraging partial parameter sharing between the generator and the detector, a cross-attention mechanism for efficient message retrieval, and a temporal conditioning module for improved message distribution. Additionally, we propose a psychoacoustic-aligned time-frequency (TF) masking loss that captures fine-grained auditory masking effects, improving watermark imperceptibility. XATTNMARK achieves state-of-the-art performance in both detection and attribution, demonstrating superior robustness against a wide range of audio transformations, including challenging generative editing at varying strengths. This work advances audio watermarking for protecting intellectual property and ensuring authenticity in the era of generative AI.