Just another WordPress.com weblog

voice recognition

Speech recognition merupakan salah satu jenis biometric recognition yaitu proses komputer mengenali apa yang diucapkan seseorang berdasarkan intonasi suara yang dikonversi kedalam bentuk digital print,Pengenalam pola suara adalah salah satu aplikasi yang berkembang saat ini, sistem ini mengijinkan kita untuk berkomunikasi antara manusia dengan memasukkan data ke komputer, salah satu fungsinya adalah untuk meningkatkan efisiensi industri manuifaktur, mengontrol mesin dengan berbicara pada mesin itu

AS mempunyai “AHLTA,” atau Angkatan Bersenjata Aplikasi Teknologi Kesehatan longitudinal, yang berfungsi sebagai alat pencatat kesehatan elektronik militer.

Dengan cara tersebut para pasukaan militer tidak perlu mengetik atau mengklik mouse setiap menitnya. Sejak program ini dijalankan AS lebih bisa menghemat waktu tanpa mengetik manual, serta diagnosis dan informasi yang menciptakan catatan yang lebih rinci.

Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara.

Pengenalan ucapan dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua, yaitu pengenalan pengguna (identifikasi suara berdasarkan orang yang berbicara) dan pengenalan ucapan (identifikasi suara berdasarkan kata yang diucapkan).
Aplikasi speech recognition diantaranya :
– “Call home”
– “call routing”
– “domotic appliance control and content-based spoken audio search”
– entri data sederhana (misalnya memasukkan nomor kartu kredit)
– penyusunan dokumen terstruktur (misalnya sebuah laporan radiologi)
– pidato-untuk-pengolahan teks (misalnya pengolah kata atau email)
– dalam pesawat terbang cockpits ( biasanya disebut Direct Voice Input)

Skema Utama Speech Recognition

Terdapat 4 langkah utama dalam sistem pengenalan suara :

1. Penerimaan data input
2. Ekstraksi yaitu penyimpanan data maasukan sekaligus pembuatan database untuk template
3. Pembandingan / pencocokan yaitu tahap pencocokan data baru dengan data suara ( pencocokan tata bahasa ) pada template
4. validasi identitas pengguna

Proses pencocokan suara

Secara umum, speech recognizer memproses sinyal suara yang masuk dan menyimpannya dalam bentuk digital. Hasil proses digitalisasi tersebut kemudian dikonversi dalam bentuk spektrum suara yang akan dianalisa dengan membandingkannya dengan template suara pada database sistem. Sebelumnya data suara masukan dipilah-pilah dan diproses satu per satu berdasarkan urutannya. Penilaian ini dilakukan agar proses analisis dapat dilakukan secara paralel.
Proses yang pertama kali dilakukan ialah memproses gelombang

kontiniu spektrum suara ke dalam bentuk diskrit. Langkah berikutnya adalah proses kalkulasi yang dibagi menjadi 2 bagian
1. Transformasi gelombang diskrit menjadi array data
2. Untuk masing-masing elemen pada array data, hitung “ketinggian gelombang (frekuensi)

Ketika mengkonversi gelombang suara ke dalam bentuk diskrit gelombang diperlebar dengan cara memperinci berdasarkan waktu, Hal ini dilakukan agar proses algoritma selanjutnya (pencocokan) lebih mudah dilakukan. Namun efek buruknya ialah array of array data yang terbentuk akan lebih banyak. dari tiap elemen array data tersebut dikonverrsi dalam bentuk bilangan biner. data biner tersebut yang nantinya akan dibandingkan dengan tempalte data suara

Proses divide and conquer
1. Pilih sebuah angka N, dimana N merupakan bilangan bulat kelipatan 2, bilangan ini berfungsi untuk menghitung jumlah elemen transformasi FFT
2. Bagi dua data diskrit secara (dengan menerapkan algoritma divide and conquer) menjadi data diskrit yang lebih kecil
berukuran N = N1.N2
3. Upa masalah (objek data) dimasukkan ke dalam tabel sebagai elemen tabel
4. Untuk setiap elemen data dicocokan dengan data pada template (pada data template juga dilakukan pemprosesan digitalisasi menjadi data diskrit dengan cara yang sama dengan proses digitalisasi data masukan baru yang ingin dicocokan)
5. Setiap upa masalah disatukan kembali dan dianalisis secara keseluruhan, kecocokan dari segi tata bahasa dan apakah data yang diucapkan sesuai dengan kata yang tersedia pada tempalte data
6. Verifikasi data, jika sesuai proses lebih lanjut sesuai dengan aplikasi yang mengimplementasikan algoritma ini

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s