言葉の森

明治大学の総合コンテンツ製作サークル（CCC）にて作成した音声認識型メディアアート。

Google Speech APIを使って音声認識を実現しました。

Node.js製のCLIアプリを録音用と音声認識用に2つ。音声認識で得られたテキストをProcessingから読み取って、エフェクトを再生するという構成となっています。

反応する単語を含んだ文章を読み取らせると対応したエフェクトを表示します。

反応するもの以外の単語を読み取らせると、Wikipediaから規定の文字数だけ説明を読み取って表示します。

macOSでのみ動作します。

動作環境

Node.js がインストール済み
Homebrew がインストール済み
SoX を Homebrew にてインストール済み

インストール方法

npm install

git cloneをしてプロジェクトのディレクトリで下記のコマンドを順に実行します。

$ cd src
$ npm install

リソースの配置

data.zipを/src/effects/へダウンロードして解凍してください。 /effects以下のディレクトリ構造が以下のようになっていれば準備完了です。

effects
├── Dictionary.pde
├── Effect.pde
├── HeavyRain.pde
├── Rain.pde
├── Recording.pde
├── Ripple.pde
├── STFlow.pde
├── Snow.pde
├── Time.pde
├── data
│   ├── NotoSansCJKjp-Bold.otf
│   ├── SE1.mp3
│   ├── ts
│   └── 波
│       ├── 波_00000.png
│       ~
│       └── 波_00119.png
└── effects.pde

サービスアカウントキーの配置

Google Cloud Platformからサービスアカウントキーを/src以下にapp-credentials.jsonとして配置します。

配置が完了し、起動準備が完了していると、/src以下のディレクトリは下記のようになります。

src
├── app-credentials.json
├── data
│   ├── request.rq
│   └── voice.raw
├── effects
│   ~
├── node_modules
│   ~
├── package-lock.json
├── package.json
├── recorder.js
└── transcriptor.js

動作手順

CUIアプリの起動

shellを起動してウィンドウもしくはタブを2つ作ります。
$ cdコマンドで両方のカレントディレクトリを/srcへ移動します。
片方のウィンドウに$ node recorder.jsを入力して、recorderを起動します。
もう片方のウィンドウに$ node transcriptor.jsを入力してtranscriptorを起動します。

「Start watcing ~ file」とそれぞれのウィンドウに表示されればCUIアプリは起動完了です。

アプリの終了は^Cです。

Processingアプリの起動

src/effects/effects.pdeをProcessingで開き、実行

操作手順

Processingアプリ上でスペースキーを押すことで録音が開始されます。

うまく認識されない時はスペースを押した後少ししてから話し始めるようにすると認識される場合があります。

LICENSE

MIT

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

言葉の森

動作環境

インストール方法

npm install

リソースの配置

サービスアカウントキーの配置

動作手順

CUIアプリの起動

Processingアプリの起動

操作手順

LICENSE

Files

README.md

Latest commit

History

README.md

File metadata and controls

言葉の森

動作環境

インストール方法

npm install

リソースの配置

サービスアカウントキーの配置

動作手順

CUIアプリの起動

Processingアプリの起動

操作手順

LICENSE