直面している問題
単語帳やメモリーカードを使って語彙を学ぶことは、日本の高校生にとても人気があります。 彼らは、志望する大学のテストに出題されるであろう英単語彙を網羅するさまざまな英単語の本を購入している現状があります。
解決策
プロジェクトの概要
Castdiceチームは、データマイニングとコンピュータービジョンテクノロジーを使用して、大規模な公開テストデータセットからすべての語彙を収集します。 モバイルアプリでは、ユーザーはこれらのデータからさまざまな大学やレベルを対象としたさまざまな単語帳を閲覧、作成できます。
チャレンジ
- 公開テストデータは適切に整理されておらず、pdf、スキャン画像などのさまざまな形式になっています。
- その公開テストから英語の文章を集めた後、使用する前にそれらを辞書形式の単語に変換する必要があります。
- 時間とリソースは非常に限られているため、2か月以内にベータテストを開始するには、2つのモバイルアプリを迅速に開発する必要があります。
結果
データマイニングモジュールを構築して単語データベースを構築し、Flutterに組み込まれた1つのソースコードを使用して2つのモバイルアプリケーションを開発します。
主な機能
クローラーによるデータマイニング
データ収集にWebクローラーを利用し、画像からテキストへの変換にOCRを使用し、単語データをデータベースに入力する前に単語ステミングプロセスを実行するデータマイニングモジュールを実装します。 このモジュールを毎月実行することで、新しいデータを収集し、単語データベースに更新することができます。
過去問から単語帳を作成
単語データには、過去にその単語を使用した大学とテストの日付がラベル付けされています。そのため、ユーザーは動的フィルターを使用して、大学と試験日の選択に基づいて単語帳を作成できます。
テクニカルスタック
デスクトップクライアントのアーキテクチャ
- Firebase
- Flutter
サーバーアーキテクチャ
- Python
- GCP