BrainTalk (For IP User)
【開発用臨時のガイドです】
BrainTalk(For IP User)は、大規模言語モデルLLM(生成AIエンジン)を使用した特許業務関係者向けに開発されたチャットアプリケーションです。
<<特徴>>
●文書とデータについての大規模言語モデルLLM(生成AIエンジン)の見解を求めるモードと一般知識を求めるモードを搭載
・文書やデータを分析する等の一般知識以外のLLMの見解を求める業務アプリとして開発されました。様々な業務文書に関してのセカンドオピニオンを求めやすいUIになっています。
●大規模言語モデルLLMの能力を最大限に活かす仕組み
・一般的なAIチャットと異なり添付ファイルのデータをブラックボックス的な処理を最小限にしてユーザーに対して明示的に質問におくります。また、どの程度のトークン数を消費しているかをデバッグしながら継続した質問をできるチャットです。これにより、特に大量の特許情報等のデータについての見解を求める場合、より精度の高い回答を得ることができます。
●特定の文書に反応してよくある質問タブを表示
・ファイル名をウエイクアップワードとして典型的な特許業務のワークフローのよくある質問タブを呼ぶことができます。一般的なAIチャットでは、一つの質問キーワードと反応して関連するよくある質問タブが出現しますが、BrainTalkでは文書やデータ内容に反応してよくある質問タブが出現します。
◎ファイル名ウエイクアップワード
・明示的に文書やデータ名に次の言葉を入れて下さい。システムでは他のワードやデータ構造でも質問タブを出現させますが、正確に出現させるために、以下の文字をファイル名に記載することを推奨しています。尚、質問タブは複数のファイルを添付した場合には反応しません。例えば、拒絶理由通知書の場合は、対象となる明細書を1ファイルに連結してファイル添付して下さい。複数ファイルで質問する場合は、ご自身で自由な質問をして下さい。
・特許一覧 ・特許公報 ・発明提案 ・拒絶理由通知 ・調査報告
・「調査依頼(プロパティ用)」)が含まれていれば、そのカテゴリ専用の質問ボタンを表示する。
●セキュリティ対策~お客様の質問データはセッション毎に破棄されます。
・本チャットアプリでは、大規模言語モデルLLM(生成AIエンジン)APIへ質問として送られる以外は、お客様のデータはセッション終了と共に全て破棄します。保管型の他のシステムと違い、安心して社内文書を扱うことができます。(注意) BrainTalkは標準でGeminiAPIを使用しています。2025年7月現在のGoogle社での規約では、不正使用の監視目的で55日間質問が保存されることを宣言しています。貴社のセキュリティポリシーに従ってご判断下さい。
<<注意事項>>
・
・使用トークン数は履歴や添付データをAIが完全に理解できいるかの目安となります。
・他のChatと違って、バックグラウンドで適宜に履歴をカットしません。容量の多い添付データを間引いて理解したり、トークン調整で適当に履歴をカットしたり間引きされることを防いでいます
・正常な判断をAIにさせるため、トークン(理想トークンは3200程度と言われています)のデバックやチャット履歴(履歴が回答の質に影響します)を意識しましょう。必要に応じてデータを再加工して再アップしたり、セッションをリセットして再スタートして下さい。
・本チャットはテキストベースのチャットです。
・PDFに注意! 画像PDFは質問に送るテキストが存在しません。事前に確認して下さい。本アプリでは参考情報として第1頁のみがOCRによりテキストとして質問に送られますが、テキスト内容を保証するものではありません。
・画像ファイル(単数)はOCR変換されたテキストとして質問に送られます。
・文書中の画像オブジェクトは質問として無視されます。
・エクセルはデータフレームとして送られます。文書として送る場合は、PDFやワードに変換して送ることを推奨します。
・特許情報で扱うデータは、1行がワンセットレコードのデータのため、本チャットでは、意識的にセット情報の質問として送ります。これにより、例えば、公報番号と出願人等が分離されて回答されることを防いでいます。逆効果としてエクセルは文書としては扱われないので注意が必要です。
・添付ファイルに関しては以下の制限があります
1.容量制限 10MB・5ファイルまで
2.添付ファイルの種類 csv/xlsx/txt/docx/pptx/pdf
3.csv/xlsxは、【データ】として扱います。【文書(テキスト)】として扱うためには、他の拡張子に変換して下さい。
4.複数ファイルの制限:csv/xlsxは1ファイルのみ。txt/docx/pptx/pdfは上限が5ファイルです。
・ウエイクアップワードが重複した時は、判定順で優先した質問タグが表示されます。
——————————-
現在の状況と意図の再確認:
CSV/Excelファイルと画像ファイル: これらは「文書」扱いせず、質問ボタンは表示しない。
TXT, PDF, DOCX, PPTXファイル: これらを「文書」として扱う。
単一の文書ファイルがアップロードされた場合:
メモ
特定のキーワードが含まれていなければ、汎用的な文書質問(「要約」「重要事項」「質問応答」など)を表示する。
複数の文書ファイルがアップロードされた場合:
質問ボタンは表示しない。ユーザーは自由にテキストで質問する。
CSV/Excelと他の種類のファイルの混在はエラー。
CSV/Excelの複数アップロードもエラー