言葉で切り分ける(第3回声ブログ)

音声認識と言葉の型抜き.
20120131193954f53

(この記事は,2014年5月8日に大学からの帰り道で撮影した声ブログを文字起こししたものです.文字起こしの際に,話し言葉に特有の「えーと」のような間投詞を省略し,話題の順序を読みやすいように並べ替えました.動画で話されたそのままの文章ではありません.歩きながら撮影した前提で話されている内容もありますが,状況を推察しながら読んでください^^ 動画本体は記事末尾に掲載します)


声ブログという遊び

今日は2014年5月8日.バスを乗り過ごしたというか,待ってたら2台同時に来たんだよね.どっちに乗ったらいいのかよく分からなくて.前のバスの乗り口が開いたから,後ろのやつも開くのかなと思って様子見ちゃったんんだよね.そしたら後ろのやつは乗り口開かずにそのまま通り過ぎちゃって,バス乗れずじまい.2台同時に来たら普通わけ分からないでしょ.運転手の人のがマイクでアナウンスしてたから本当はそれで分かるべきなのかもしれないけど,その時俺はイヤホンで音楽聴いてたからね.と不満もありつつ.バス待ってると20分経っちゃうし,20分待ってそれから10分くらい掛けて駅に行くくらいなら,30分さっと歩いて駅まで行ったほうがいいかなと思ってね.健康にもいいし,スタスタ歩けばもうちょっと早く着くんじゃないかとも思ってる.ということでまた声ブログ.
060430-135530

声ブログするのこれで3回目なんだけど,今日は第1回目と同じ場所を歩いているから景色を写してもしょうがないね.写真のスライドショーでも出そうかな.声ブログのビデオを自分で編集してて思うのは,「意外と自分は滑舌が悪い」ということ.一人でぼそぼそ喋ってる.大きな声でハキハキと喋るのははたから見ると奇妙 になっちゃうからちょっと遠慮してたんだけど,そうすると結局何言ってるか分からない.何言ってるかわからない動画を,時間を割いて編集して世に送り出し てもあんまり意味がなくてね.だったら何か言ってるビデオをちゃんと投稿したい.なので今回はハキハキと喋りたいと思います.第2回では地元の公園を歩いたんだ けど,その時は声帯を震わせない無声母音みたいな感じでずっと喋ってて,それは聞き取りにくいし良くなかった.はっきりと喋りましょう.
第1回の声ブログした時も木曜日で,それもセミナーの後だったんだけど,今日はセミナーが早くて午前中で終わったんだよね.午後に面接だからどのみち早退 する予定だったんだけど,でも午前中で終わってよかったね.第1回のときに歩いてた道に,今は凄くツツジが咲いて真っ赤で綺麗.良いね.映像ちょっとだけ 撮るか.これ撮れてるのかな.道の対岸も凄く真っ赤で綺麗.こっち側もあっち側も.いいね,キレイキレイ.あ,チョウチョ!
あれ,今バスに抜かされたね.もしかしてあれ乗れたのかな,そんなことないかな.乗れたとしたら凄く面倒くさい思いをしてる.補償してほしいわ.バスに抜 かされてるんだけど,ということは俺は次のバスを待ってた方が良かったのかな.別に待ってなくても良かったけどね.スマホのディスプレイを風下に向けてマ イクは風を受けないように頑張ってるつもりなんだけど,録音はどうかな.風ボーボーで何も聞き取れなかったら,このビデオ没になっちゃうな.けど俺の言い たいことは何かしらの形で残ってほしいね.これは自分用の記録だからね.

ビデオとYouTubeと音声認識

今撮ってるビデオの解像度は100いくつ×100いくつなんだよね.たぶん手ブレしまくって何も見えない映像になってるはずだけど.本当は声だけ録音したいいんだよね,今撮ってる映像を見せる予定は無いからさ.声だけ録りたいんだけどどうやるんだろうね.声だけの録音のやり方が分からない.そういうアプリきっとあるよね,ボイスメモみたいなやつね.
robots

YouTubeに動画を公開してる人ってのはどういう人なんだろうね.若い人から年寄りまでいると思うけど,今のトレンドはやっぱり子どもたち,小中学生 とかがいっぱいビデオ載せてるのかな.大人は子どもと違って遊んでばかりじゃいられないから割と商売っけのある動画を出すけど,子供は友達と遊んでる時に たまたま撮ったビデオが面白かったとかいうことがたぶんあり得る.
第1回声ブログして動画編集してYouTubeに載せた時に,YouTubeが勝手に文字起こし機能とか言ってビデオ内で聞き取れる声を文字起こししてくれるのね.その文字を表示させて字幕付きで動画を見ることができるんだけど,それ凄く便利だよね.文字起こしの精度はダメダメだった.もちろん俺の喋り方が曖昧だったというのもあるんだけど,精度は悪かったね.全然聴いたこともないような単語が出てきて,逆にそれはそれで面白いんだけどね.「何を言ってるんだ,このGoogleは(笑)」みたいな感じ.
人間は,人の言葉を聞き取れるじゃない.機械は,「音」を聞くことはできても「言葉」を聞くことはできない.何を言われてるのか分からないんだよね.いろんな声の強弱とか音程の変化とか聞き取って区別して,何を喋ってるのか理解する機械ができたらすごいね.そんなことできるかな,まぁやればできるだろうけど.でも喋り方なんて人によってバラバラだし,そもそも滑舌のいい人と悪い人で喋り方は違うからね.ダ行とラ行が明確に言い分けられない人とかいるかもしれないしね.俺だって今録音してるのを,あとで聞いて聞き分けられるかどうか分からない.ダヂヅデドのダ,ラリルレロのラ.ダラダラ.ラダー.

俺が喋るときのこと

声ブログした時に感じたのは「編集する作業は意外としんどい」.俺の今喋ってるのをこのまま生で垂れ流すと凄いことになってる.第2回声ブログの2-2っ ていうのは無編集でそのまま垂れ流してるから俺が喋ったままのRAWデータが聞こえるけど,俺の喋り方って途切れ途切れなんだよね.考えながら喋ってるからそ ういう風になっちゃうんだけど.発言が微妙な途切れ方をするから,それをごまかすために編集で1秒とか0.5秒かとの間を切らなきゃいけないわけ.その作 業が凄く面倒くさくてね.自分の喋ってるのなんて聞かないから分からないけど,普段から人と会話するときもきっとこういうふうに喋ってるんだよね.声ブロ グ編集が,その癖を見直すきっかけになれば良いね.きっとスピーチ上手になれるよね.
117

こないだ声ブログして思ったのは「一人で歩いてるつまんない道も,独り言グダグダ喋るだけで意外と楽しく感じるし,しかもその道のりを短く感じる」.アタマを回転させてるからかな.歩きスマホするなって言われるけど,やっぱり歩きスマホしたいじゃん.歩いてる間って暇だしさ,考え事するのもいいけど,何か作業しながら考えたって別にいいじゃんね.だから歩きスマホしたいんだけど,液晶画面は太陽光の下じゃ見えづらいから,結局昼間は歩きスマホしなくなるんだよね.夜は液晶のバックライトが煌々と照って見やすいから,時々バイトの後とかに歩きスマホするけどね.歩きスマホできるといい暇つぶしになるからできればやりたいんだけど,昼間はやれてない.現に今帰ってる時間は14:30だけど,今歩きスマホ出来ないからね.じゃあ何しようかって,「音楽聴く」だけでもいいんだけど「声を録音して思い出を残す」.これは誰か人に聞かせるというつもりで話してない.自分であとで聞き返すという気持ちも無きにしもあらず.
今日は就活の面接の日.大事な面接が控えてます.ここで受からないともう持ち球が少なくて厳しいので,この面接はしっかりやりたいことろ.でも面 接のコツなんて分からないよね.どうすればいいのよ.「こいつ就活厳しそうだな」とちょっと舐めてた奴が意外と就活ガンガン受かりまくってて,俺は就活に 自信があったわけじゃないけど,今のところ全然うまくいってないんだよね.という現状を見ると,「どういう人が求められてるんだろう」って思う.もちろん 会社ごとに欲しい人は違うと思うけど,「なぜあいつが!」みたいなね.なかなか刺激的な体験だよね.

「つくる」

最近スマホ用のぷよぷよのアプリをダウンロードしたんだけど,そのメニュー画面が汚くて最悪なんだよね.デザイン失敗の素晴らしいお手本を地で行くような,最悪な見づらさ.今どきのスマホアプリってのは何でも詰め込めばいいと思ってるのか,要素が多すぎて画面が見にくいんだよね.慣れちゃえばいいんだけど,俺はそれに慣れたくない.それに慣れちゃうと,いざ俺がものを作る立場になった時にそういうのを作っちゃいそうだからね.いつまでもああいうのには抵抗感を感じていたい.慣れちゃったらお終いだよ.やっぱり俺はものを作る人でありたいと思ってるからね.
20013016824

いわゆる「メーカー」ってのは,PanasonicとかSonyとかCanonとか資生堂とか,そういうのをメーカーって言うかな.「化学メーカー」とか,いろいろあるよね.これから俺が面接を受ける会社は,「ものを作る会社」なのよ.でもこの場合の「ものを作る」って,メーカーみたいなものづくりじゃないよ.「ものづくり」って言わない方がいいのかな,じゃあ何て言い表そうか.絵を描いたり動画を作ったり音楽を作ったり映画を撮ったり作曲して歌を歌ったりっていうのは,生産的な活動で,創作的な活動で,ものづくりといえばものづくり.だけど,いわゆるカメラ作ったり冷蔵庫作ったり化粧品作ったりするのとは一線を画するじゃない. “industory” じゃない,工業じゃないもの作り.

言葉で切り分ける

「クリエイティブな」って言い方好きじゃない.「クリエイティブな仕事」って言い方が,俺は好きじゃないんだよね.俺は「クリエイティブな」って言い方に納得いかないんだよね.でもなんて言ったらいいんだろうな.「生産的な」?「創作的な」?「商品そのものに価値がある」っていうのも違うねえ.「割と芸術っぽいところがあるものづく り」.「工業じゃない」って言い方は割と的を射てるかもしれないね.工業じゃないもののことをなんて言うんだろう.何が違うのかな,言い分けられない.そこを明言化できるようにならないとやっぱりダメだな.まだ素人の域を出ない.
20120131193954f53

「言葉で言えるかどうか」は頭の中の整理具合を如実に反映する.自分の言葉で説明できるか,自分の言葉で言えるかどうかってのは大事な問題.言葉は物事を規定してしまうわけよ.例えば,人間の感情は連続的で形のないものだけど,それを「嬉しい」っていう型に嵌めてみたり「悲しい」っていう型に嵌めてみたりするでしょ.「言葉」は「型」で,「喋る」ということは「型に嵌める作業」なんだよね.クッキーの型抜きみたいに,型から溢れてしまったカスは表現できない.だからその点で,感情のすべてを表現し切れないってのは言葉の弱点だね.でも逆に言えば,自分の頭の中で整理されてないものを,ちゃんとパキパキっと型に嵌めて整理することもできる.言葉はそういう機能も持ってるよねと,俺は日頃から思ってるわけです.
もうそろそろ駅着いたからやめるか.第3回声ブログでした.今20分だから,10分とか8分くらいの動画になるかなあ.

オマケ

これが動画本体.なぜこれを掲載して終わりにしないのか?ここで全て話されてるなら文字起こしする必要ないよね?わざわざ手間ひまかけて文字起こしして読みやすく編集して掲載する意味は何なのか.一部再生してみたらすぐに分かるよ.


風のノイズで聞き取りにくすぎ!二度と聞きたくないし,俺のじゃなきゃすぐに次の動画に移りたくなるような最悪の低品質動画!笑

コメントを残す

Powered by WordPress.com. テーマ: Baskerville 2 by Anders Noren

ページ先頭へ ↑

%d人のブロガーが「いいね」をつけました。