Arvix-Web

評価基準

評価基準

Arvix-Webでは、料金、コード修正、安全性、研究用途、作業の流れ、データポリシーを分けて評価します。優劣を断定する前に、必要な根拠を明示します。

評価軸と重み

現在の合計重みは100です。情報が変わった場合は、基準も見直します。

重み 20

料金・制限の透明性

月額料金、無料枠、利用上限、チーム利用、解約条件を確認できるかを評価します。

必要な根拠

  • 公式料金ページ
  • 最終確認日
  • プラン変更履歴

注意点

料金情報は変わりやすいため、断定的な安さ比較だけで記事化しません。

重み 25

コード修正タスクの再現性

同じNext.js/TypeScriptタスクで、修正回数、build結果、余計な差分の少なさを評価します。

必要な根拠

  • 入力プロンプト
  • 生成された差分
  • npm run build結果
  • 手直し回数

注意点

一度だけの成功・失敗で優劣を断定せず、複数タスクで見ます。

重み 20

安全性・権限設計

秘密情報、認証、認可、Webhook署名検証、ログ出力などのリスクを確認します。

必要な根拠

  • 該当コード片
  • 権限条件
  • 失敗時の挙動
  • 公式ドキュメント確認

注意点

セキュリティ評価は専門監査ではないため、重要な実装では別途確認が必要です。

重み 15

研究用途での出典追跡性

要約や回答から一次情報へ戻れるか、引用・PDF・GitHub実装と紐づけられるかを評価します。

必要な根拠

  • 出典リンク
  • 検索条件
  • 取得日
  • 誤要約の有無

注意点

要約の自然さだけで研究用途の有用性を評価しません。

重み 10

日常作業への組み込みやすさ

エディタ連携、ブラウザ利用、チーム共有、履歴管理、再利用性を評価します。

必要な根拠

  • 利用環境
  • 設定手順
  • 利用頻度
  • チーム共有可否

注意点

個人の慣れだけで使いやすさを断定しません。

重み 10

データ利用・プライバシー

入力データの保存、学習利用、管理者設定、企業利用時の制約を確認します。

必要な根拠

  • 公式ポリシー
  • 管理画面の設定項目
  • 対象プラン

注意点

ポリシーはプランや地域で異なる可能性があるため、一般化しすぎません。