【AI】AIで複数の同時音声を分離、再現率は脅威の90% 深層学習で音声の分け方を学ぶ: [無断転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
1ののの ★2017/05/29(月) 20:44:06.12ID:CAP_USER9
http://eetimes.jp/ee/articles/1705/29/news084.html

三菱電機は研究成果披露会で、同社独自のAI技術「ディープクラスタリング」を用いた音声分離技術を発表した。この技術では、マイク1本で録音した複数話者の同時音声を分離し、きれいに再現できる。従来の技術では原音再現率が51%だったが、三菱電機の音声分離技術の場合90%以上となる。
[辻村祐揮,EE Times Japan]
答えではなく、解き方を学ぶ

 スマートフォンやカーナビなどの音声認識機能は、雑音や複数の人の声が混じると正しく機能しないことが多い。音を聞き分けて再現する技術自体は既に存在するが、精度の面でまだ十分とはいえない。マイク1本で取得した音声を分離し再現する技術の場合は特にだ。

 三菱電機が同社独自のAI技術「ディープクラスタリング」を用い、音声分離技術を開発したのにはこのような背景がある。三菱電機は2017年5月24日の研究成果発表会で、マイク1本で録音した複数話者の同時音声を分離し、きれいに再現する様子を披露した。

https://youtu.be/KC_xJpF1R4E
ディープクラスタリングで2者の同時音声を分離するデモ
 ディープクラスタリングとは、ディープラーニングとクラスタリングを組み合わせたものだ。三菱電機が開発した音声分離技術は、複数話者の同時音声の成分をクラスタリング(分類)し、分類した成分をそれぞれのクラスタで合成することで、各話者の音声を再現する。音声成分の分類は、抑揚や音の流れといった音声特徴の類似をもとに行う。

 一方、特徴の類似をもとに音声を分離する“仕方”を学ぶのがディープラーニングの役目だ。人工知能を活用した従来の音声分離システムの場合、音声の特徴がどの話者に帰属するかを学んでいた。つまり、答えを丸暗記していたのだ。そのため、学習済みでない音声の識別ができなかった。しかし、三菱電機の音声分離技術はディープラーニングで、音声の特徴を分類する仕方そのものを学ぶ。答えではなく解き方を学ぶため、初めて対応する音声でも的確に処理することができる。

http://image.itmedia.co.jp/ee/articles/1705/29/Yt_20170529_mitu.jpg
ディープラーニングとクラスタリングによる音声分離、再現の説明図 出典:三菱電機
 三菱電機の音声分離技術は、音声を話者に結び付けて学ぶわけではないので、話者の性別や言語に依存しない。いかなる話者相手でも、2者の同時音声を分離した場合、90%以上の原音再生率を発揮できる。従来の技術では51%だった。一方、3者の同時音声を分離した場合、原音再生率は80%以上となる。また、学ばせさえすれば、人の声だけでなく雑音の分離も可能だ。

 三菱電機の説明員は、「ディープクラスタリングをカーナビの音声認識機能に応用すれば、音声入力中に同乗者の声や車の走行音が混じったとしても、カーナビはドライバーの音声だけを分離して認識できるようになる」と語っている。

2名無しさん@1周年2017/05/29(月) 20:45:11.75ID:behUnDL50
カクテルパーティ効果

3名無しさん@1周年2017/05/29(月) 20:47:35.79ID:5BDwdqUj0
これで音声認識もわざわざマイク近くで喋んなくても、雑音除去して自然な声を聞き分けれるって事?
これって、かなり凄いんじゃない?

4名無しさん@1周年2017/05/29(月) 20:47:54.12ID:fH5sDXO/0
能無し三菱電機

5名無しさん@1周年2017/05/29(月) 20:50:23.73ID:C1ZfLk1p0
声域分離でしょ
ナビは指向性マイクをハンドルに付けるだけでいいかも

6名無しさん@1周年2017/05/29(月) 20:50:26.77ID:dfKcQQVr0
聖徳太子かよ

7名無しさん@1周年2017/05/29(月) 20:51:47.97ID:fmCpJNKN0
事実上使い物にならない技術w

8名無しさん@1周年2017/05/29(月) 20:52:04.82ID:6qHwbplr0
何年か前にアシモが実演してなかったか

9名無しさん@1周年2017/05/29(月) 20:53:15.09ID:UqvgWJIt0
光ケーブルの多重伝送みたいなもんじゃねえか

10名無しさん@1周年2017/05/29(月) 20:53:47.10ID:vmbQAqLd0
黒柳徹子と平野レミが同時に喋っても即テロップ化

11名無しさん@1周年2017/05/29(月) 20:55:34.50ID:D1GA1g090
90%というのがほんとうに実用かどうか。
90%以上をカバーするという英単語集を覚えても10%わからないと
全然意味がとれかったのを思い出す

12名無しさん@1周年2017/05/29(月) 20:55:41.89ID:r7tPkX2X0
曲の歌だけ完全に拾えたりするのかな

13名無しさん@1周年2017/05/29(月) 20:57:35.29ID:inz+2R680
原音再現率が謎
再現できていなくても識別可能かも?

14名無しさん@1周年2017/05/29(月) 20:58:38.21ID:pMbLyUSRO
すごぉいなー ほんと聖徳太子みたいじゃんかー
神の領域だわ

15名無しさん@1周年2017/05/29(月) 20:58:39.88ID:UGpso6pT0
嘘くせえ

16名無しさん@1周年2017/05/29(月) 20:59:08.80ID:ykcVmsJB0
これものすごいな、Googleとかが協業しようと言ってきそう

17名無しさん@1周年2017/05/29(月) 21:01:20.92ID:fmCpJNKN0
カーナビを買うと、漏れなくGPU1000個が付いてきますw

18名無しさん@1周年2017/05/29(月) 21:01:48.81ID:+miUJfrg0
これ本当に実用性があるなら
世界中の会社で会議の録音に使われることになるな

19名無しさん@1周年2017/05/29(月) 21:05:20.56ID:puclJ91p0
>>7
ラジオ番組の自動文字起こしをやってみてはどうかな?
自動文字起こしをして、ネット配信してはどうかな?

20名無しさん@1周年2017/05/29(月) 21:05:21.47ID:ykcVmsJB0
音声認識技術で必須と言える機能だから
研究してる企業は多そうだけど、発表出来るほどの出来のところはまだないから
大幅にリードだな

21名無しさん@1周年2017/05/29(月) 21:05:28.96ID:W2iYL8wd0
合体ロボでの操作や会話に必要不可欠な技術

22名無しさん@1周年2017/05/29(月) 21:10:27.50ID:55Op8UqY0
居ないはずの人の声が

23名無しさん@1周年2017/05/29(月) 21:15:59.46ID:K9q9bQNR0
>>6
確か先週のニュースで取り上げられていて見た時にそう思った。

24名無しさん@1周年2017/05/29(月) 21:16:28.52ID:su1l+TSN0
このまま議事録まで作ってくれると大変ありがたい

25名無しさん@1周年2017/05/29(月) 21:16:37.27ID:MCvlgDLP0
マクドナルドの注文できるようになる?
ぜんぶドナルドの人形にして欲しい

26名無しさん@1周年2017/05/29(月) 21:17:12.10ID:K9q9bQNR0
国会のヤジの出所がわかったりしてw

27名無しさん@1周年2017/05/29(月) 21:17:29.55ID:R5X6Cv8O0
スパイ活動に最適だなあ。

28名無しさん@1周年2017/05/29(月) 21:19:44.63ID:MCvlgDLP0
>>24
議事録ってあんまり見なくない?

29名無しさん@1周年2017/05/29(月) 21:20:11.00ID:ICxF6JFJ0
聖徳太子知ってる?

30名無しさん@1周年2017/05/29(月) 21:26:53.19ID:QPaWWiH90
>>10
いい歳だろw

31名無しさん@1周年2017/05/29(月) 21:27:50.39ID:h/HKHX620
発達障害者は抜かれたな

32名無しさん@1周年2017/05/29(月) 21:35:43.58ID:fH5sDXO/0
独自で開発する能力がないから、概出している技術を発展しましたて言うオチ

33名無しさん@1周年2017/05/29(月) 21:35:47.54ID:Sw1qAPAE0
ビル・ゲイツ「優秀なソフトウェア・プログラマーは平均的なプログラマーの10,000倍の価値がある。」

http://tracpath.com/works/story/high_performance_computing_programmer/

「優秀な旋盤工の賃金は平均的な旋盤工の数倍だが、優秀な
ソフトウェア・プログラマーは平均的なプログラマーの10,000倍の価値がある。」
※この話しはビル・ゲイツがシリコンバレーの常識を代弁しただけだから
ゲイツの個人性や能力は関係ない

ITによって(アメリカでは)一個人の生産性は飛躍的に高まった
アメリカ企業が年収数千万円の給料を惜しげもなく払うことに驚く奴は多いだろう
その数百倍、数千倍の付加価値を生み出せる人材ということだ

反面、100万人のソフトウェア・エンジニアが雇用されているのに、
シリコンバレーの企業経営者は優秀なソフトウェア技術者が足りてないと嘆く
今でも十分に成功してるのにだ

アメリカ人は製造・サービス産業を自動化でほとんど無人化にする
までエンジニアを雇うつもりらしい
そのためにはもっとソフトウェア技術者が欲しいということだ

だが日本ではその自動化が生み出す付加価値創出の中核部分であるコーディングを低賃金で働く外注や
非正規に任せるという倒錯ぶりだ

そもそもソフトウェア技術で会社の競争力を上げて付加価値を出すためには、長い下積みが必要だ
米ベンチャー企業は皆若いというが、技術者は40代以上が中心であり20代は殆どいない

https://www.quora.com/Whats-the-age-distribution-for-software-engineers-hired-at-Facebook-or-Google-Is-being-in-ones-late-20s-considered-a-detriment

日本式の技術者育成にはソフトウェア時代には絶対通用しない短期育成方針もあるが新卒から育成しようという致命的な構造欠陥がある

ソフトウェア・エンジニアの育成に失敗するのは当たり前だ
ソフトウェアを一から書ける才能というのは、教えられても芽生えない
本人が在学中か、個人の余暇活動を通じて自己育成するのが前提だ
アメリカで20年かけてるソフトウェアエンジニア育成を日本では社内で行えるとでも思っているのだろうか

日本式の身分構造だと、社員は20年経験のある専門卒・3流大卒の下請け中高年キモデブヲタのほうが
エリート社員の俺様よりも適正=能力があり、付加価値を生み出せる現実を直視できない
勉強は得意でCSの理論は得意なんだから10年も必死で勉強すれば追いつけると考え自己研鑽すれば良いのだが
それでは駄目らしく、コードは卑しいもの(=作業員)がおこなう業務ということで落ち着く

大抵の新卒は始めは技術力で入社したと思いこんでるはずだが下請けとのソフト開発の実力差を思い知らされて心が砕かれる
そしてプライドを保つために管理業務(コミュニケーション力)に特化することになる
「マネージメントスキル」という言葉を使いだすのが老害の境地とすれば、日本の新卒は数年で老害化する
先進国中でも営業が一番むずかしい国家と日本はされてるが、それはマネージメントが肥大化したというのも一因だ
営業活動が非合理に増えればそれに寄生する老害も増えることになる。

アメリカでは新卒で雇っても無能であれば解雇すればいいだけだから、その面でも有利だ
統計はないが米ITの新卒の定着率は1割以下だと聞いたことがある
適正がない技術者は他の方面の仕事を早い段階で探せるし、老害を抱えなくて済む米企業の
双方にとってウィン・ウィンの関係だ

34名無しさん@1周年2017/05/29(月) 21:36:56.21ID:qON/+OwJ0
意味にまで踏み込まないで声色だけで分離するんじゃないかと思う。
音声は有限次元の状態ベクトルで表現しやすいからディープラーニングとの相性は良さそう。

35名無しさん@1周年2017/05/29(月) 21:37:52.68ID:Sw1qAPAE0
http://www.meti.go.jp/committee/sankoushin/shin_sangyoukouzou/pdf/008_04_00.pdf

(1)我が国の現状
第4次産業革命への対応は、欧米が先行しながら急激に進展している。既に「バーチ
ャルデータ 3」を巡るデータ競争「第1幕」では先行する GAFA(Google, Apple,
Facebook, Amazon)が大規模なプラットフォームを形成しており、大きく水を空けられている。

こうしたデジタル経済における新たな競争を勝ち抜くためには、我が国自ら新た
なイノベ ーションを生み出す力、新陳代謝を通じて産業構造・就業構造、経済社会システム
の変革を生み出すダイナミズムが不可欠。しかしながら、我が国では、未だ資本や労働の流動性が低く、
産業構造・就業構造が硬直化したままであり、我が国経済全体 が「老朽化」。このままでは、
第4次産業革命に十分に対応することは困難。

(2)第4次産業革命の2つのシナリオ~日本は今、「分かれ目」
第4次産業革命への対応を巡っては、日本は今、まさに分かれ目に立っている。

現状のように、企業・系列・業種の壁や自前主義が温存されたままでは
、グローバルな データ利活用の基盤であるデータプラットフォームを海外に
依存せざるを得なくなる。その結果、海外のプラットフォーマーが付加価値を吸収し、
そのプラットフォームの上で我が国産業が下請け化しジリ貧に至る懸念が大きい。

また、既存産業が温存され、労働市場も固定化し、人材育成も従来のまま継続し
てしまうと、機械化・デジタル化による雇用機会の喪失、機械・ソフトウェアとの競争
による賃金の低下に直面することとなり、中間層の崩壊・二極化が進展。

第4次産業革命の極めて早い変革スピードを目の前にすると、日本に残された時間はもはや少ない。

36名無しさん@1周年2017/05/29(月) 21:37:58.25ID:mRts5Vx20
お分かりいただけただろうか。

37名無しさん@1周年2017/05/29(月) 21:38:12.47ID:Sw1qAPAE0
第8回「IoT/インダストリー4.0が雇用・経済に与える影響に関するドイツにおける研究の最新状況 (NO.5)」
http://www.rieti.go.jp/users/iwamoto-koichi/serial/008.html

新しい作業環境が出現すると、職業訓練を経て、新しい仕事に振り替えないといけない。

イノベーションサイクルが短くなると、企業自身が率先して再訓練しなければならなくなる。

そこでIGメタルが心配することは、新しいイノベーションの波が来たとき、労働者を全て解雇し、
改めて労働市場から新しい労働者を雇用するという米国のマネをするのではないか、という点
にある。そうしないと、再訓練には時間とお金がかかるので、米国の企業と競争できなくなっ
てしまうからだ。

38名無しさん@1周年2017/05/29(月) 21:38:33.69ID:Sw1qAPAE0
社会底辺と第4次産業革命

第1グループ(ニート)
・15〜35歳。親の収入で生活。学歴がある人もそれなりにいる。
・自由に時間を使えたりすることで、勤労者を小馬鹿にするか見下している。
・社会との関わりが薄いためルサンチマン濃度は中程度。プライドは高い傾向
・BIにすがり付く傾向あり。

第2グループ(フリーター、非正規)
・アルバイト・パート・派遣・業務委託などで働く
・先の見えない現状や非正規への差別に不満
・ルサンチマン濃度は高い。憎しみの矛先は同僚や上司、会社。無政府状態になれば敵を皆殺しコースか

第3グループ(無職)
・中高年が多い。
・ルサンチマン高濃度が多い。学歴や経歴が良いほど、濃度が高くなる。
・大半はBI・所得再分配の財源に懐疑。期待はしていない。

第4グループ(廃人)
・全年代。 (第1〜3グループからの転向が多い)
・人生終了しており死を恐れる必要がない。
・ルサンチマンの塊。妬みと憎しみぐらいが生きる目的。人間として終わってる。
・憎しみの対象はさまざまだが、個人的な恨みと、社会・司法システム(責任部署・組織に所属する者)への恨み、2ch・SNS等の不特定者(通信記録を調べれば身元は即判明)の2つに分類できる。
・命、金に興味がないため、ベーシックインカムに期待しない。
・第4次産業革命による社会混乱上等、日夜戦闘力を磨いている。
・来る内戦に備えて軍事訓練(戦犯・悪党狩りに志願する予定)に参加している。戦犯・悪党狩りについては「9月30日事件 」を参照。 狩る敵をリストアップするのが日課。

結論:
グループ2〜3はグループ4への一歩手前。既得権益層に対し強い恨みと怒り。左派に支配されたマスコミ、労組や連合、厚労省、検察・裁判所、搾取業者(とその構成員、大企業正社員含む)への強烈な怒りが生きる原動力

39名無しさん@1周年2017/05/29(月) 21:38:57.15ID:Sw1qAPAE0
227 : 名刺は切らしておりまして2016/06/17(金) 16:10:30.8 ID:SeG1Ttqg

>>222

気を落す必要はないよ
AIの開発競争に敗れるだけでなく、大失業時代に大企業は対応できず
日本の経済はズタズタにされ、餓死者が街にあふれ貧民出身軍人によるクーデーターが起きる。
その時になれば、労組、搾取業、その他活動家(ネット活動家含む、左派、右派関係なく、
搾取などのルサンチマンが堆積した業界人)
が日本経済破壊の戦犯ということが判明し、怒った下層民やその支持を受ける軍人
に皆殺しにされると思われる。
おそらく怒った派遣奴隷などに目をくり抜かれるなどの壮絶死を遂げる可能性が高い

無論、SNSや2ch、Twitter、Facebookに書き込んでるような管理人を含めた工作員も通信記録を
照会すれば即座に判明するから、クーデーター時に連中も瞬殺・粛清されると予想する。

前スレ:
http://maguro.2ch.net/test/read.cgi/haken/1345022380/450-500

40名無しさん@1周年2017/05/29(月) 21:39:10.51ID:Sw1qAPAE0
一方で日本は発展途上国に落ちていき、企業は次々とつぶれ

自動化・AI化で唯一の競争力の源泉だった自動車も危うい状況

社会が貧困化すれば、クーデターやテロが頻発する典型的な発展途上国

の政情不安定状態になる

解雇規制撤廃と年功賃金撤廃が無ければ、今まで甘い汁を吸って

きた共産・連合も含む弱者の敵に怒りの嵐が吹き荒れるだろう

41名無しさん@1周年2017/05/29(月) 21:39:26.19ID:Sw1qAPAE0
過渡期の日本は混乱で死体だらけだよ

私利私欲と保身しかない連中は、日本にとって癌でしかないから
そういう奴らこそ自決を迫られる(運がよければ人道的な死に方を選ばせて貰えるという意味で)

知能があって本当に破壊(復讐や進歩を邪魔する老害の排除)をしたい人間がいるなら
混乱期が来るまでおとなしくまってると思うぞ
今はそういう連中は静かだが、その時になったら発展途上国で毎日殺し合う世の中が再現される


↓(ちゃんと読め、そして現実から逃げないことだな、未来のお前のことかもしれないぞ)

尊大で向上心のない思考停止と無行動、私利私欲でしか動かない腐った人間性と精神性のままでは、
経済も国の財政も、弱者の支援も儘ならないと日本人は骨の髄まで思い知ったわけだが

改革と向上をあきらめた現在、さらなる地獄を見ることは必然だよ

20年前なら日本の経済発展は日本の民族や文化が優れていたからと自信を持って言えただろうが
そう考える日本人は今や少数派だろう、ならば20年前なら今の日本人は皆自虐的に映るに違いない。

42名無しさん@1周年2017/05/29(月) 21:39:40.50ID:Sw1qAPAE0
連合や全労連、共産党がいくら文句をいおうが、東芝の社員は救えない

倒産するような企業に解雇規制など無いも同然

自動化で日本の全企業が倒産の危機にあるのに
解雇規制は何の役にも立たない

解雇規制がまるで託宣のように考える主張してる連中は、日本から基幹産業を担う企業が
消えたら、仕事自体が無くなるから規制の対象も消える事を意図的に言わない

非正規・下請けの搾取利権は絶対に手放せないということなんだろう

無論、派遣企業も解雇規制が撤廃されれば需要が無くなるから、厚労省や法務省に
働きかけるというわけだ

これでは、弱者のルサンチマンが堆積するのもの仕方の無いことだ

43名無しさん@1周年2017/05/29(月) 21:41:27.67ID:B1HpupCq0
聖徳太子だな。
だけど実用的にはどういう場面で使うんだ?

44名無しさん@1周年2017/05/29(月) 21:43:26.32ID:qON/+OwJ0
>>43
マイクが他人の声や騒音を拾ってしまったのを消すのに使うとか

45名無しさん@1周年2017/05/29(月) 21:47:36.60ID:bGV6XF2N0
例の菅野美穂解析待った無し

46名無しさん@1周年2017/05/29(月) 21:53:16.11ID:Jb2cxpGv0
これ凄いと思った
カクテルパーティ効果
これまでは独立成分分析とかでやってたが
2つの音声の連立方程式の解を解くのに
2つの音声データが必要だった

これが1つで済んだことは凄い

47名無しさん@1周年2017/05/29(月) 21:55:42.80ID:Jb2cxpGv0
何人まで分離できるか気になるな

48名無しさん@1周年2017/05/29(月) 21:57:33.58ID:OZuReLJr0
特定の人の声以外のいらない音を消したり、逆に複数をそれぞれ同時認識・処理したり
音楽を認識して自動でその通りパートも分けて作曲したり

使い方は色々ありそう

49名無しさん@1周年2017/05/29(月) 21:59:11.77ID:Jb2cxpGv0
この中で理解してるのは>2だけだな

50名無しさん@1周年2017/05/29(月) 21:59:47.58ID:U6E0De8B0
今日はAI関連記事が山盛りですね。
これだけ宣伝していただくと、明日もAI関連株が上がってしまいます。
ありがとうございます。
まだの人は早めにAI関連株を買っておきましょう。

51名無しさん@1周年2017/05/29(月) 22:01:07.68ID:+lQbAHrn0
>>3
画像認識と音声認識はディープラーニングで劇的に進化するよ

でも、推論マシンはヘイズ理論入れてもまだまだだと思うんで、人の仕事が無くなるとかは大きな誇張

ロボットは進化してるから、力仕事は置き換わるが、そもそも人手不足の業界なので雇用は減らない

52名無しさん@1周年2017/05/29(月) 22:01:13.82ID:OZuReLJr0
合唱も全部一人づつに分解できると恥ずかしいですね
カメラとあわせてスパイ・監視にも最適だよねぇ

53名無しさん@1周年2017/05/29(月) 22:03:25.40ID:OZuReLJr0
大きな音・声を認識して打ち消し処理した後に残る
ひそひそ話をノイズから分離増幅して聞けるのもヤバくね?

54名無しさん@1周年2017/05/29(月) 22:03:54.33ID:6786pnQx0
自律的なモーダル解析か
人数判っても、どうやって分離するんだろう

55名無しさん@1周年2017/05/29(月) 22:04:03.16ID:9rCTjfR70
モノラル録音のステレオ化がついに!

56名無しさん@1周年2017/05/29(月) 22:06:45.20ID:JE/bggv40
>>43
国会の速記

57名無しさん@1周年2017/05/29(月) 22:07:47.25ID:6786pnQx0
画像認識より圧倒的に難しそうなんだが
ただ音楽用ソフトでは、ピアノ演奏やらを録音したとこから単音レベルに分離して編集しちゃうソフトはもう実用化してはいる
モーダルと倍音列の予測的アプローチでかなり実効的にいけちゃうのかもしれない

58名無しさん@1周年2017/05/29(月) 22:10:01.89ID:CSUDiwyL0
携帯のスピーカーきら聞こえてくる相手の声は、再現された別の声
豆な

59名無しさん@1周年2017/05/29(月) 22:12:05.79ID:ORghyoqM0
人類でこれができたのは聖徳太子だけっだったという
人類終わった

60名無しさん@1周年2017/05/29(月) 22:12:44.04ID:6786pnQx0
ポリフォニック音源の分離と編集

https://www.youtube.com/watch?v=93yXresJD4E

これ

61名無しさん@1周年2017/05/29(月) 22:13:13.25ID:3fPCP87l0
>>43
YouTubeの自動字幕起こし→翻訳とか

62名無しさん@1周年2017/05/29(月) 22:15:49.58ID:OZuReLJr0
聖徳太子以上の認識力の恐ろしい地獄耳で「はいはい、こそこそしてたようだが全部聴かせてもらったよ〜」もあるなwww
混ざったものから認識できるようになるって恐ろしい一面もある


ろくでもない事にも使うのは世の常だからなー

63名無しさん@1周年2017/05/29(月) 22:18:37.36ID:5aOOSztn0
飛行機のボイスレコーダーとかにも応用できそうだな

64名無しさん@1周年2017/05/29(月) 22:20:53.71ID:6786pnQx0
>>1
精度高いな、つべ見て驚いたわ
つかはやくこれ民生でだしてくれよ
めっちゃ夢が広がるわ

一方で何をもってひとつの音声とみなすかっていう認識論的問題もあるな
オーケストラとか1パート自体がすでに複数のレイヤードトーンなわけで

65名無しさん@1周年2017/05/29(月) 22:21:54.56ID:qON/+OwJ0
>>52
合唱だと相関が強すぎて分離できないと思う

66名無しさん@1周年2017/05/29(月) 22:29:51.10ID:6786pnQx0
ビートルズのハードデイズナイトの冒頭の謎和声もこういうので分析されて一応解明されんだよな
音楽の分析にはもってこいのツール、そしてミュージシャンにとってはパンツ脱がされるような羞恥プレイの世界だ

67名無しさん@1周年2017/05/29(月) 23:20:32.06ID:3F24Vjd50
カクテルパーティ効果は使ってないの?

68名無しさん@1周年2017/05/29(月) 23:23:51.06ID:uMzTsUoK0
>>28
責任の押し付け合いをする社風の企業では議事録は必須。

69名無しさん@1周年2017/05/29(月) 23:24:32.56ID:kYn8P8CQ0
ブラインド分離か、独立成分分析でちょこっとだけやったことあるけど
ディープラーニング使うといい感じに行けると・・・ふむ
またちょっと手を出してみるかな(手あかが付いてるとただの遊びになっちゃうが)

70名無しさん@1周年2017/05/29(月) 23:26:38.59ID:MCvlgDLP0
>>68
そういう使い方するのか

71名無しさん@1周年2017/05/30(火) 01:05:55.91ID:CuNpPnAh0
>>1
●偏差値50私立理系新設バイオ大学へ入学して卒業した。
すると、無職(むしょく)の私を見て親は混乱、動揺(どうよう)、狼狽(ろうばい)した。
親が混乱、動揺、狼狽する姿を見たくない。
そうなら、中学生は進学高校へ、高校生は上位大学へ入学したほうがいいよ。

医学部は、実験を外部雇用の高技能職人「テクニシャン」がやる。ピペットをチュッチュする生化学検査等々だ。
女は生まれつき手先が器用で、バイオ実験が男性教授より早くて正確だ。性差能力ゆえ、努力は無関係だ。
バイオ大学の教授は、バイオ実験を有料テクニシャンではなく無賃で頭おかしい女子大生にやらせたがる。
それで偏差値50バイオ大学は、女なら「金と結婚」以外のわがままは何でも通る構造問題がある。
東京坊ちゃんの私そっくりの田舎坊ちゃんが「不良と癒着(ゆちゃく)するその女」に近い人間関係で変死した。
詳しい事情は不明だが、こういう不吉なことも起こっているので、なおさらモヤシ金持ちから結婚を断られる。

図書館の対面テーブルで女が首周りの開いた服で座り、かがんで乳首を出して見せて「きゅきゅしまる」と話しかけてきた。
学園祭で私に向かってスカートをまくってショーツを見せた。
四つんばいでお尻の中に収納されている女性器を後方の私へ着衣のまま突き出す行動、ロードシス反射をした。
http://dietmastermax.cocolog-nifty.com/blog/e0751895.jpg http://i.imgur.com/HHpHhRW.gif
http://i.imgur.com/kH9DPtx.gif http://i.imgur.com/1LErd3X.jpg http://i.imgur.com/gcacPpd.jpg
それぞれ別人の女たちだ。複数行為をした重なる女もいる。

普段、問題児の女たちは、モヤシ金持ちのことをコキ下ろして振り向かせ、セックスを迫る。
私は体調不良で何年も休学し復学した。
復学の4月から再びイジメが始まり、半年過ぎの12月で私は、なかば女たちに屈服した。
女の住所電話番号を聞いて、ウソのラブレターでお世辞オベッカを言うようになった。
世間向けに言えば、7ヶ月間、私の悪口を言ってる女が、私から住所を聞かれる。
聞かれると、1分以内に女自身の住所を書いてよこすのは異常だった。

●奇声の田舎娘

金持ちの悪口を言う側の女たちだ。
東京女にもいろいろいて、そういう富裕層に批判的な立場にいるタイプの東京女たちだ。
彼女たちなら、そのまま金持ちの悪口を言って媚びて、不良の心をわしづかみで、その悪口男と結婚する。

そういう富裕層に批判的な立場にいるタイプの田舎娘たちには、間違っている娘たちが多かった。
お金持ちの悪口を言う人々の輪の中心で、お金持ちと露骨に結婚したがっていた。
(これを私が人に言うと、幻覚で片付けられ、私は叩かれ大損する。以降、口をつぐむ。)

問題児の田舎娘たちは、不良に媚びへつらい、不良よりも強い筋肉金持ちを避け、モヤシ金持ちを探していた。
モヤシ金持ちに噛み付いて、濡れ衣で大損させ無職破滅させ、弱ったところで求婚して、相手モヤシに断られる。
東京坊ちゃんの私そっくりの田舎坊ちゃんが「不良と癒着(ゆちゃく)するその女」に近い人間関係で変死した。
詳しい事情は不明だが、こういう不吉なことも起こっているので、なおさらモヤシ金持ちから結婚を断られる。

モヤシに濡れ衣を着せ、女側からモヤシに求婚すると同時に、悪口不良の輪の中でモヤシから求婚されることも待っていた。
女から軽く頼まれた程度でも、不良の縄張りにいる女とのセックスはしっぺ返しリスクが高すぎて、交尾は無理だ。
問題児の田舎娘たちは、お金持ちへ気配り気づかいで、チンコにゴムつけてしゃぶるタイプか?それはしなかった。

私はその女たちが不良や教授から一方的に婚期を搾取されていると勘違いして、何度か話し合いをした。
5分を過ぎると、彼女たちは、共通して奇声を発して精神錯乱を起こし、記憶と正気を失った。
実際の奇声はアとオの中間のサイレン音だ。
https://www.youtube.com/watch?v=6BpMz54h-dQ https://www.youtube.com/watch?v=Yk9KqKe5i2s
明石家さんまの名言「生きてるだけで丸儲け」

web-n16-041 2017-01-11 07:41
http://i.imgur.com/drW66sW.gif http://i.imgur.com/C2kNdXa.gif http://i.imgur.com/uTBtmoD.gif
http://i.imgur.com/LrHrZZk.gif http://i.imgur.com/Gm3cojN.gif http://i.imgur.com/tcVQf8r.gif
http://tamae.2ch.net/test/read.cgi/kouri/1494757421/35-
かき

72名無しさん@1周年2017/05/30(火) 01:06:56.18ID:CuNpPnAh0
>>71
●高校生のころ読んだ文庫本のゲーテの言葉だ。

昔の劇作家のゲーテが、机で何かモノを書いている。ドイツの文豪のゲーテだ。
人間関係に悩む若者がドイツの劇作家の書斎にタイムスリップした。
売れっ子で脚本の注文が溜まって忙しく、途中であなたをチラ見し、上から目線でこう言った。
「キミ、その人間の正体を知りたければ、その人間の友人たちをココへ連れてこい。
 私がソイツの友達だけを見て判断し、ソイツの本性をズバッと言い当ててやる。
 人間の本性なんて友達だけで全部わかる。」
なにせ高校生ぐらいに読んだ文庫本のひとつなので、
言葉尻はあやふやでゲーテかどうか人違いかもしれないが、
こんな内容だった。
『人間の本性なんて(本人を見なくても)友達だけで全部わかる。』・・・・・・・・・か。

田舎娘の友達は、カネでイヤなことがあったんだろう、金持ちの悪口ばかり言っていた。
当時、金持ちの自分には、その友達がキライだった。
仮に、金持ちと結婚する高校卒業年齢の女なら、
女は人間関係を清算して、その友達と絶交していただろう。

>お前、さっきから一方的にしゃべっているけど、誰と話しているの?
> 1日4時間もラブレターを書いて異性に一方的に好意を寄せてストーカーしたら、
>教授会で指弾されても仕方ないよ。
>あなたのこれまでの悪行を考慮すると、自殺して被害者に償わなければいけない。

ウソのラブレターを送ったのは、私が大学を卒業するためだよ。
卒業を邪魔する女を殴って排除できるか?できないだろ。
モヤシ金持ち側からウソのラブレターで、
「サイコ女→モヤシ金持ち」のイジメを手加減させた。
女はどういう形であれ、私を振り向かせることには成功したわけだ。
そこから先は、女の技術や私との相性で、女は技術も相性も悪かった。

> 不良や女から具体的にどんないじめ行為があったのか教えてよ。
> 暴力はあった?

●問題の解決はそことは違う。証言を捨てて、物証への転換だ。物証のみが宝だと。
バイオ女はモヤシ金持ちに振り向いてもらうためにイヤガラセ求婚をする。
イヤガラセ求婚は注目を寄せるシグナルだから、比較的に物証が取りやすい。

イヤガラセ求婚され、「イヤガラセ」と「求婚」の物証をそれぞれ取って、その矛盾証拠を父に提出。
証拠がそろえば、偏差値50のバカ息子の妄言とは違い、これは事実だと伝わる。
猛威を認めれば、父は女から間接的に狙われてる自分の財産を守るため金を出す。
父の金で弁護士を呼んで、「イヤガラセ」はどの法律に抵触するか決める。裁判用の証拠を取る。
アリバイで、教授と大学窓口に解決を事前依頼したあとで、訴訟だ。これが正解だったんだろう。

女を守るための正義の味方のフリして、私の勉強実験、大学生活全般を陰に陽に邪魔する。
女がおおやけに罪人認定されれば、不良や教授は正義の味方として私を叩くのは難しい。
難癖の半分くらいは消えて楽になる。妨害が半分消えれば自立準備できただろう。
莫大な労力を投入する不良や教授のイジメ証明はスキップできる。

ヒエラルキーの低い金持ちを狙ってバイオ権力で不良や教授をテコにイヤガラセ求婚する。
「不良の輪で呼吸したい。同時に、不良よりも弱い金持ちの財産で結婚生活したい。」
【不良を愛玩ペットにして、(筋肉金持ちを避け、)モヤシ金持ちにイヤガラセ求婚する。】
彼女たち【全員】が、不良を守るために「筋肉金持ちを避けてるシグナル」を100%完璧に隠し抜いた。怖い。

女が悪い人に搾取されてると、錯覚で見える。人間が体験する「脳」の錯覚って、神様ヒドイ。
私にとっては、彼女たちが不良や教授から婚期を「一方的」に搾取されてるように、錯覚する。

・大学で目の前に富裕層がいるのに、不良の輪でスーハー呼吸する。
・発情期に入ってYesをNo、NoをYesとアマノジャクな精神錯乱をする。
勉強実験に忙しい私は楽チンな女が好きなんだ。面倒臭い女キライ。かき

73名無しさん@1周年2017/05/30(火) 01:07:56.54ID:CuNpPnAh0
>>71
●イヤガラセ求婚は1日も早い解決をしよう。イヤガラセ求婚は物証が取りやすい。

イヤガラセ求婚されると、モヤシ金持ち坊ちゃんは実験勉強を邪魔されて無職破滅する。
(心理学社会学インテリに「実験勉強を邪魔される→無職破滅」は理解不能な人がいる。)
どうやら女たちは「結婚するには、損させればいい。」と思っているから、損させるわけだ。
彼女たちは「イヤガラセ求婚されたら、男は結婚を受けろ。」とモノの考え方が違う。

女子大生がイヤガラセ求婚をしたら、結婚を断るだけ。
結婚ってなに?
子孫繁栄の進化的に安定な最適戦略のひとつでしょ。(ほかの戦略もあるけど。)
イヤガラセ求婚は子孫繁栄とは違う。
大学生同士だと子孫繁栄で行動するから、イヤガラセ求婚されたら結婚を断るだけ。

イヤガラセ求婚を無視したり、やり過ごそうとすると、破滅する。
女本人はイヤガラセ求婚すれば結婚できると確信してるので、無視すれば、さらに攻撃してくる。
バイオ女は教授に次ぐ発言力がある。
話し合いで女それぞれ言い回しが違っても、中身は「結婚しろ!さもないと、ぶっ殺すぞ!」だ。
細かい話し合いをすれば、女は5分で奇声を発して精神錯乱を起こす。
実際、バイオ権力で間接的にぶっ殺してくる。変死した田舎坊ちゃんもいる。
ヒエラルキーの低い金持ちを狙ってバイオ権力で不良や教授をテコにイヤガラセ求婚する。
無視ややり過ごし、先送りはだめで、法的手段に訴える必要がある。

不良や教授のやる陰湿イジメを法的に証明するには、「たぶん」女の証言が必要だ。
女は黙る。裁判に耐える証言はゼロだ。「たぶん」法律の限界だ。助かるには何をしようか?
イヤガラセ求婚は私に届ける女たちの自己アピールだから、比較的に記録が取りやすい。
バイオ権力で叩かれたら、証拠を取って訴訟が正解だろう。

●偏差値50バイオ

・不良
不良は男便所の私の隣でシブキと音を出しながら、こういう意味をほのめかす。
「あの女たちは誰と結婚しても不倫で俺たちの子を産むリモコン女だ。」と。
ションベンを出しながらほのめかすので、オス犬散歩の壁ションと同じマーキングだ。
このとき、女がかわいそうだと義憤を感じたら、それがワナで、人生は負け。
不良女が富裕層と結婚したがるのは、もともと性格の悪いカネカネ女だ。
不良は本当のことを動物的マーキングで自慢してるだけ。あれは勝利宣言だ。
不良はむしろ正常で、わざわざ不良の輪で呼吸してるカネカネ女が異常だ。
正常なカネカネ女は、不良から逃げ、富裕層のチンコにゴムつけてしゃぶる。

・バイオ大学
バイオ大学は、手先の器用な女に無賃でバイオ実験を手伝ってもらい成り立つ国家だ。
無賃でバイオ実験を手伝う見返りに、「お金」と「結婚」以外のワガママは、何でも実現する。
人が死んでもウヤムヤになる。女に生まれれば、誰でも(たぶんね)バイオ実験はうまい。
女が無賃ロボとしてバイオ実験させておいたほうが、大学にとっては得だ。
女がセントラルドグマのような代謝や情報を学んだり、富裕層と恋愛することは、邪魔だ。
学部生が専門知識ゼロは10年後に困るが、医療大学へ学部改変すれば済むことだ。
バイオ大学は、医療大学を作る地ならしのための踏み台であり、または、摘果だ。

・女が悪い人に搾取されてると、錯覚で見える。人間が体験する「脳」の錯覚って、神様ヒドイ。
私にとっては、彼女たちが不良や教授から婚期を「一方的」に搾取されてるように、錯覚する。
「不良の輪で呼吸したい。同時に、不良よりも弱い金持ちの財産で結婚生活したい。」
【不良を愛玩ペットにして、(筋肉金持ちを避け、)モヤシ金持ちにイヤガラセ求婚する。】
彼女たち【全員】が、不良を守るために「筋肉金持ちを避けてるシグナル」を100%完璧に隠し抜いた。怖い。

バイオ大学は、手先の器用な女に無賃でバイオ実験を手伝ってもらい成り立つ国家だ。
組織構造問題だから、モヤシ金持ち坊ちゃん側は前述の証拠を固めて法廷闘争だ。
裁判に勝っても、居心地が悪ければ、坊ちゃん自ら去ったほうがいい。

かき

74名無しさん@1周年2017/05/30(火) 01:08:57.61ID:CuNpPnAh0
>>71
●一部のバイオ女たちからイヤガラセ求婚された。
バイオ女たちは教授に次ぐ発言力がある。イヤガラセ求婚で勉強実験を邪魔され無職になる。
バイオ女たちは4年間限定の権力者だから、イヤガラセ求婚されたら、証拠を取って訴訟だ。
イヤガラセ求婚は自己アピールだから、記録して物証を押さえやすい。
私はタイミングを逃したので、イヤガラセ求婚は取れるタイミングに、証拠保存したほうがいい。
誤解があるのかと深読みしたくなるけど、深読みすると失敗する。
遺伝子組み換えや抗がん剤を作れる知的な女に、誤解なんかない。ワザとやってる。

かき

75名無しさん@1周年2017/05/30(火) 01:46:57.44ID:HiVT/qGU0
カーナビに雑音とともに録音された会話を抽出したいと思ってたとこだ。
当たり屋の詐欺未遂を立証するために。

76名無しさん@1周年2017/05/30(火) 06:16:35.67ID:k8c7qbwX0
国会の速記はAIに任せちまえばええなw

77名無しさん@1周年2017/05/30(火) 06:28:35.82ID:7PPhjf1/0
流石の三菱電機様だな
日本一の財閥企業なのにグーグル・アマゾンに現状ボコボコにされてるザマではやばいと感じはじめて本気出したか
このシステムの開発自体は世界でも初めてだろう。
この技術と現状のグーグル・アマゾンのAIスピーカーの技術を組み合わせるだけで、AIスピーカーのレスポンス機能はさらに格段に向上する

78名無しさん@1周年2017/05/30(火) 07:03:21.50ID:ixMrxXoA0
AIのニュースが無い日は無いな
シンギュラリティはもう始まってる

79名無しさん@1周年2017/05/30(火) 15:29:46.23ID:KBeB+InN0
仕掛け見るに
1。話者A、Bそれぞれ独自の音声とその混合音声の3つが無いと学習できない。
2。話者A、B、C、D…がいたら、すべてのペアについて学習が必要
となりそうなのだが。独立成分分析ならまったく原理が違うのでそうはならない
はず。驚異の精度の背景にはこういうトレードオフがあるんじゃないか?

80名無しさん@1周年2017/05/30(火) 18:16:33.89ID:k2eXvDkx0
そのような研究は、ずーっと昔からやられておるわ、たとえば以下のものを
みたらええ。
 http://www.kecl.ntt.co.jp/icl/signal/sawada/mypaper/subspace2010rev.pdf

電波通信の発信元を推定するとか、水中に置かれたマイクロホンを使って
複数居る潜水艦の位置を探るとか、そういう軍事からみの部分もあって、
軍事関係では昔からこっそりやられていたはず。

81名無しさん@1周年2017/05/30(火) 18:31:50.67ID:KBeB+InN0
>>80
なにも分からんなら大人しくしてろバカ。これは全く違う原理だっての。
識別率が全く違うって>>1にも書いてあるだろうがバカが

82名無しさん@1周年2017/05/30(火) 21:48:10.64ID:z1rFbsKl0
そうはいっても、事前に何かしらの手がかりはいるとは思うんだけどな
人間だって例えば目隠しで紛糾してる朝生の討論の現場に連れてかれたら、状況把握は相当むずかしいわけで
デモでは男声女声の2声でモーダルがまるで違うからその点では一番まだ楽な領域ではある、すごいんだけどね

83名無しさん@1周年2017/05/30(火) 21:54:29.15ID:z1rFbsKl0
インパルスレスポンスのインバースぽい残響除去(ソースの明瞭化)とかも実用化しているし
いろいろ組み合わせでいずれ認識力の水準は人間を超えていくのかもね

■ このスレッドは過去ログ倉庫に格納されています