医学統計ツール Reactive stat の Table 1 がパワーアップ:欠損値処理の強化と群分類機能を大幅拡充
エミュイン合同会社
公開日:2025/5/12
~データの透明性と分析精度を向上させる新機能で研究者の統計解析ワークフローを効率化~
医学統計ツールの開発・提供を行うEMUYNは本日、無料のオンライン統計分析ツール Reactive stat の Table 1 の機能アップデートを発表しました。今回のバージョンアップでは、研究データに含まれる欠損値の処理機能を大幅に強化するとともに、群分類オプションを拡充しました。これにより、臨床試験や疫学研究において重要な基本統計表(ベースライン特性表)の作成がより正確かつ効率的に行えるようになります。 「Table 1」は、バックエンドにRエンジンを採用しており、高度な統計計算を可能にしながらも、ウェブベースの直感的なインターフェースを通じてユーザーが複雑な設定をすることなく高品質な統計表を作成できることが特徴です。p値の計算にはRの統計関数を活用し、結果の信頼性を確保しています。さらに、統計結果に対する解釈支援機能も備えており、適切な統計手法の選択と結果の解説をサポートします。 今回の更新により、研究データに不可避的に発生する欠損値の処理と表示方法が大幅に改善され、データの透明性と再現性が向上します。また、複雑なデータセットを整理するための「その他」グループ機能の追加など、より柔軟なデータ分析環境を実現しました。
今回のTable 1のアップデートでは、多くのユーザーから要望があった「欠損値処理の改善」と「群分類オプションの拡充」を中心に機能強化を行いました。
研究データには避けられない欠損値。この処理方法が研究結果の信頼性と透明性に大きく影響することを、私たち統計の専門家はよく理解しています。今回のアップデートでは、欠損値をより透明かつ正確に扱うための機能を追加しました。
欠損値グループの表示機能
群分類または副群分類に欠損値がある場合、これらを「欠損値」群として独立表示できるようになりました。たとえば、患者の治療グループ(A群・B群)が記録されていない症例がある場合、これらを「欠損値」として明示的に表示できます。これにより、データの完全性がひと目で把握でき、論文査読者や同僚研究者にもデータ品質を明確に示せます。
【設定例】 「群分類の欠損値を欠損値で表示」オプションを有効にすると、 通常の群(例:治療群・プラセボ群)とは別に「欠損値」列が追加され、 欠損データの分布も確認できます。
欠損値数の詳細表示
全体のサンプルサイズ(N)表示時に、欠損値の件数も括弧書きで表示する機能を追加しました。これにより、「全体の何例中、実際に何例が分析に使用されたか」が明確になります。臨床試験での追跡不能例(Lost to follow-up)や回答拒否などの情報を透明に報告できるようになりました。
群分類オプションの拡充複雑な多群比較を整理し、焦点を絞った分析を可能にする新機能を追加しました。
「その他」グループ機能
群分類の非選択項目を「その他」としてまとめて表示・分析できる機能を追加しました。多数のカテゴリがある変数(例:診断名、投薬内容など)を扱う際に、主要な群と「その他」に分けて整理できます。これにより、表の視認性が向上し、重要なグループ間の差異に焦点を当てた分析が可能になります。
【活用例】 診断名が10種類ある場合、主要な3疾患を個別に表示し、 残りの7疾患を「その他」としてまとめることで、 見やすい表を作成できます。
「その他」グループの統計処理の最適化
順序性を前提とした統計手法(線形回帰分析、Jonckheere-Terpstra検定、Cochran-Armitage検定など)では、順序性のない「その他」グループを自動的に除外する機能を実装しました。これにより、順序トレンドの分析精度が向上します。
【技術的詳細】 「その他」グループは統計的に意味のある順序を持たないため、 傾向分析からは自動的に除外されます。ただし、 通常のカイ二乗検定やFisherの正確検定では含まれます。
統計表示オプションの強化より柔軟で詳細な統計情報の表示が可能になりました。
信頼水準の選択
信頼区間の水準を90%、95%、99%から選択できるようになりました。研究の目的や分野の慣行に応じた適切な信頼水準での分析が可能です。
統計量表示の詳細制御
パラメトリック検定の場合に、標準偏差(SD)、標準誤差(SEM)、信頼区間(CI)の表示を個別に制御できるようになりました。例えば、平均値±SDだけでなく、平均値(95%CI)やSEMを表示するなど、ジャーナルの要求に応じた柔軟な表示形式に対応します。
実際の研究ワークフローでの活用臨床研究の最初のステップである患者背景の比較表(Table 1)作成が、今回のアップデートでより効率的になります。例えば、多施設共同研究で一部の施設からのデータに欠損がある場合、「欠損値」グループとして明示的に表示しつつ、有効なデータだけで統計検定を行うことができます。
また、疫学研究において多数の疾患カテゴリを持つデータを分析する際には、「その他」グループ機能を活用して主要疾患に焦点を当てた分析が可能になります。教育現場でも、学生が欠損値の取り扱いや適切な統計手法の選択を学ぶための実践的なツールとして活用できます。
私たちは今後も、研究者の皆様の貴重なフィードバックをもとに、「Table 1」の機能を拡充していく予定です。統計表作成の手間を削減し、研究の本質的な部分に集中できる環境を提供することで、医学研究の発展に貢献していきたいと考えています。
ブラウザとデータファイルがあれば、すぐに解析できます
・マニュアル本は要りません。
・すべての統計手法のページには、利用に必要な解説が載っていますし、必要な情報へのリンクも用意してあります。
・PCにソフトウェアをインストールする必要はありません。
・信頼性の高い R での結果が得られます。
・ウェブアプリで結果を得たあとに、そのデータを外部の R サーバーに送信し、その実行結果を得ることができます。
・外部の R サーバーに送信されるデータは、セキュリティを考慮し、数値計算に必要な最小限のセットとしています。また、送信前に内容を確認できます。自動的に送信されることはありません。
・常に最新バージョンのRを利用できます。
・結果がリアルタイムに反映されるウェブアプリですので、統計解析に不慣れな場合でも試行錯誤が容易です。
・データの内容を常に把握しながら作業が行えるように工夫してありますので、どうしたらいいかわからない、という状況に陥ることがありません。
・出力されるグラフはインタラクティブな高機能なものです。
・データファイルを読み込んで利用できます。
・CSV 形式データファイルおよびエクセルファイルに対応
・データファイルはブラウザ内部に読み込まれるだけで外部には送信されませんので、セキュリティの問題はありません。
・日本語のデータファイルを扱うことができます
・海外製のアプリですと、カラム名が日本語だと受け付けられないなどの制約がしばしばありますが、Reactive stat にはそのような制限はありません。
共用PCやタブレットでも
ソフトをインストールできない共用のPCや、iPad などタブレットでも実行可能です。
モバイルデバイスの場合は、 Google Drive, One Drive などのクラウドストレージからファイルを直接読み込むことができます。
読み込んだデータファイルの内容がそのままクラウドに送信されることはありませんので、個人情報を含むデータでも安心して解析できます。 共用PCの場合は、ログアウトすればすべて消去されますので安心です。
なお、R での解析やその結果を AI に解説させる機能では、クラウドに最小限のデータを送信しますが、統計解析に必要最小限のデータであり、個人情報が送信されることはなく、また、送信前にその内容を確認する手順になっていますので安心です。
スマートフォンでも
スマートフォンでも使えるように画面設計してあります!
最終的な統計解析を行うことを想定しているわけではなく、統計に不慣れなユーザーに手軽に親しんでいただくことが目的です。 専用のサンプルデータを解析手法ごとに用意していますし、 膨大な数の R のサンプルデータを簡単に検索して読み込めます。 また、できるだけ詳細に解説を付けてありますので、実際にデータを操作しながら統計を学んでいただくことが可能です。
Google Drive や One Drive のデータファイルを読み込めますので、ご自身のデータの解析して論文の原稿を書くこともできてしまいます!
インタラクティブな解析で理解が深まります
Reactive stat の名前の由来は
データの内容を常に確認しながら設定し、設定を変更するとリアルタイムにグラフなどが変化することが名称の由来です。
常にデータ内容を視覚的に把握しつつ解析を行えます
小さなヒストグラムなどで、しつこいほどにデータ内容を視覚的に示します。
統計処理においては、常にそのデータの性質、すなわち、カテゴリー変数なのか連続変数なのか、どのような分布をしているのかなどを把握しておく必要があります。
常にデータ内容を意識しつつ作業できますので、迷うことなく素早く正しい結果に到達できます。
すべての統計手法にデータと設定のサンプルを用意してあります
すべての統計手法のページには、 サンプルデータと設定の呼び出し ボタンが付いています。 これを押すと、典型的なサンプルデータと、そのデータに対する解析のための設定内容が読み込まれます。
その統計手法を初めて扱う場合でも、 どのような形式のデータが必要なのか、どのような形で結果が得られるのか、 サンプルを読み込んで実際に動かすころで理解が深まります。 そして、ご自身のデータをどう処理すればよいかがすぐに分かります。
信頼できる R の解析結果を AI に解説させて容易に理解できます
Reactive stat では、ほとんどの統計解析を R言語 (統計解析を主な目的とする専門的なシステム) を利用して行うことができます。
R は数多くの専門家が参画して作り上げられたシステムで、信頼性が高く、無料で利用できる素晴らしいものですが、なかなか敷居が高いです。 出力された解析結果も、英語で書いてあってわかりにくいです。
それを劇的に使いやすくしてくれたのが EZR ですが、インストールが必要だったり、やはり統計解析の初心者には難しいという声も聞かれます。
そこで、Reactive stat では、ブラウザでの簡単な操作で、インタラクティブに R による解析が行えるようにしてみました。 さらに、その解析結果を、AI に解説してもらう機能が付いています。
AI による解説には、そこで使われている統計手法の説明から、得られた結果の解釈、さらには学会発表や論文にどのように表現すればよいかまで含まれます。
論文や学会発表の準備が簡単になります
医療統計でよく使う統計手法を網羅しています
特に医療分野で頻繁に使われる統計手法を広くサポートし、また、医学論文で必要なグラフの作成が簡単に行えます。 今後、リクエストがあればさらに拡充してゆく計画です。
また、心理統計の領域で使われる手法も今後拡充してゆきます。
最新の R による解析結果が得られ、論文への記載が容易です
・論文発表や学会発表において、「統計解析はRで行いました」と書くことができます。・Rは通常、毎年2回 (4月と10月) バージョンアップされます。これらのリリースにはバグ修正などが含まれます。
・解析ごとに、R 本体および使用されたすべてのライブラリのバージョンを表示します。
・近年重要視されるようになった効果量の値の計算が多くの統計手法でサポートされています。
・論文にどのように書けばよいか、AI が教えてくれます。
論文や学会発表で必要なサマリー表がすぐに作成できます
ほとんどの臨床系の論文で必要とされる、症例の背景因子の表が、あっという間に作成できます。 一つ一つの因子を統計解析し、その数値をまとめて表にするのは、意外と手間のかかるのもです。 これを、本当にあっという間に作成してくれます。 ぜひお試しください。
ドラッグ&ドロップで項目を入れ替えたり、統計処理がパラメトリックとノンパラメトリックから選べたり、徹底的に使いやすさを追求しています。 使いこなしていただけると嬉しいです。
p値まで含んだ表が出力されますので、学会発表くらいなら統計処理がこの機能だけで済んでしまう場合もしばしばあります。
本当に「あっという間に」思い通りのサマリー表が作成できてしまいます!
多彩なチャートを簡単に作成できます
多く用いられるチャートを簡単に作成できるよう、チャート作成機能を充実させました。
対象ユーザー
・統計学には興味は無いが学会発表があるのでちゃちゃっとデータ処理を済ませたい方
・実際のデータを触りながら統計を学びたい初心者
・手持ちのデータを探索的に把握したい研究者
などなど、(統計学者以外の) あらゆる方が対象です。
統計結果のグラフは、設定の変更をリアルタイムに反映しますから、その理解が簡単です。 上の例にも示すように、ROC曲線における閾値の変化で、感度や特異度がどう変わるのか、実際にサンプルデータで試してみることで、その原理まで理解が深まります。
また、常にデータの内容を視覚的に示しつつ設定を進めてゆくという基本コンセプトですので、どうしていいかわからない迷子になってしまうことがありません。
Reactive stat により、統計嫌いが少しでも減ることを願っています。 そして、皆様の貴重な研究成果の発表のお手伝いができると嬉しいです。