ユーザーガイド(AI-Chat)

BrainTalk

を【開発用臨時のガイドです】

BrainTalkは、大規模言語モデルLLM(生成AIエンジン)を使用した特許業務関係者向けに開発されたチャットアプリケーションです。

<<特徴>>

・大規模言語モデルLLMの能力を最大限に活かす仕組み

BrainTalkは、一般的なAIチャット機能を添付ファイルを元に使用トークン数をデバッグしながら継続した質問をできるチャットです。

また、ファイル名をウエイクアップワードとして典型的な特許業務のワークフローの質問タブを呼ぶことができるチャットです。

・使用トークン数は履歴や添付データをAIが完全に理解できいるかの目安となります。
・他のChatと違って、バックグラウンドで適宜に履歴をカットしません。
容量の多い添付データを間引いて理解したり、トークン調整で適当に履歴をカットしたり間引きされることを防いでいます
・正常な判断をAIにさせるため、トークン(理想トークンは3200程度と言われています)のデバックやチャット履歴(履歴が回答の質に影響します)を意識しましょう。
必要に応じてデータを再加工して再アップしたり、セッションをリセットして再スタートして下さい。

・本チャットはテキストベースのチャットです。

・PDFに注意! 画像PDFは質問に送るテキストが存在しません。事前に確認して下さい。本アプリでは参考情報として第1頁のみがOCRによりテキストとして質問に送られますが、テキスト内容を保証するものではありません。
・画像ファイル(単数)はOCR変換されたテキストとして質問に送られます。

・文書中の画像オブジェクトは質問として無視されます。

・エクセルはデータフレームとして送られます。
・特許情報で扱うデータは、1行がワンセットレコードのデータのため、本チャットでは、意識的にセット情報の質問として送ります。
・これにより、例えば、公報番号と出願人等が分離されて回答されることを防いでいます。
・逆効果としてエクセルは文書としては扱われないので注意が必要です。

添付ファイルに関しては以下の制限があります
1.容量制限 10MB・5ファイルまで
2.添付ファイルの種類 csv/xlsx/txt/docx/pptx/pdf
3.csv/xlsxは、【データ】として扱います。【文書(テキスト)】として扱うためには、他の拡張子に変換して下さい。
4.複数ファイルの制限:csv/xlsxは1ファイルのみ。txt/docx/pptx/pdfは上限が5ファイルです。

複数ファイルの添付時のAIの理解についての注意点
AIが個別の文書単位であることを理解させるために明瞭なファイル名として下さい

◎ウエイクアップワード

・以下のファイル名をウエイクアップワードとして典型的な質問タグを表示することができます。
・ただし、複数ファイルを添付している時は、いずれの質問タグも表示されません。
・ウエイクアップワードが重複した時は、判定順で優先した質問タグが表示されます。

——————————-

現在の状況と意図の再確認:

Gradioコントロール効かない点
・htmlcss ・スクロールJAVA ・ダウンロードリネーム ・アップロードクリア

CSV/Excelファイルと画像ファイル: これらは「文書」扱いせず、質問ボタンは表示しない。
TXT, PDF, DOCX, PPTXファイル: これらを「文書」として扱う。
単一の文書ファイルがアップロードされた場合:

特定のキーワード(「特許一覧」「特許公報/特許番号形式」「発明提案/発明説明/アイデアシート」「拒絶理由通知書」「調査報告」「調査依頼(プロパティ用)」)が含まれていれば、そのカテゴリ専用の質問ボタンを表示する。

メモ
特定のキーワードが含まれていなければ、汎用的な文書質問(「要約」「重要事項」「質問応答」など)を表示する。
複数の文書ファイルがアップロードされた場合:
質問ボタンは表示しない。ユーザーは自由にテキストで質問する。
CSV/Excelと他の種類のファイルの混在はエラー。
CSV/Excelの複数アップロードもエラー。

error: Content is protected !!