Oleh: Mampuono, S.Pd., M.Kom.
Menulis sebagai bentuk dokumentasi dengan berbagai tujuan telah mengambil peranan sangat penting dalam kehidupan kita. Dengan dokumentasi tertulis itulah informasi diturunkan dari generasi ke generasi. Bahkan, sejarah peradaban manusia dimulai ketika pertama kalinya ditemukan tulisan sebagai dokumen yang ditinggalkan oleh manusia yang hidup di masa sebelumnya.
Tidak diragukan lagi, kebutuhan dokumentasi tertulis dalam hidup kita sangat diperlukan, terlepas dari apapun profesi kita. Sedemikian pentingnya hal-hal yang terkait dengan tulis-menulis ini bagi kelangsungan hidup manusia, bahkan perintah ketuhanan pun diwujudkan dalam bentuk dokumen tertulis (kitab suci). Mereka yang mempelajari dan menyebarkan konten di dalam kitab suci dengan cara mentransfer pengetahuan melalui bacaan dan tulisan dinisbatkan sebagai orang-orang yang berbuat mulia dan terpuji di hadapan Tuhan. Ini artinya, menulis yang begitu besar manfaatnya dan mendapat penghargaan tinggi dari Tuhan seharusnya telah menjadi kebutuhan siapapun, dan sudah selayaknya kita berbondong-bondong untuk melakukan aktivitas menulis.
Sayangnya, menulis seringkali dianggap sebagai sebuah pekerjaan yang sulit. Ini karena orang berpikiran bahwa untuk dapat melakukan keterampilan tertinggi dalam berliterasi bahasa itu lazimnya membutuhkan pengetahuan, pemikiran, waktu, dan keahlian yang memadai. Untuk bisa menghasilkan tulisan orang merasa harus pintar dulu, terpelajar, banyak referensi dan sebagainya. Padahal hal-hal semacam ini bisa dilakukan sambil berjalan. Pepatah yang berlaku adalah alah bisa karena biasa. Semakin terbiasa semakin mudah melakukannya.
Selain adanya kekhawatiran tentang tidak cukupnya pengetahuan, orang juga merasa harus cekatan menggerakkan jari jemari untuk mengetik, menuangkan pikiran ke dalam teks. Jadi, hampir dipastikan menulis adalah pekerjaan yang merepotkan bin membosankan, terutama bagi orang-orang yang inginnya praktis dan semuanya serba cepat. Padahal semua hal tersebut dapat diatasi dengan sangat efektif melalui penggunaan teknologi.
Menemu dengan STT
Di era revolusi industri 4.0 ini teknologi sudah berkembang sangat pesat. Segala sesuatunya dimudahkan dengan adanya kecanggihan teknologi, termasuk dalam menulis. Kemudahan dalam menulis tersedia lengkap di lingkungan sekitar kita, bahkan yang paling dekat dengan kita, yaitu melalui ponsel. Dan istimewanya kita dapat melakukannya kapanpun dan dimanapun, asal tempatnya tidak bising, hampir tanpa menggerakkan jari-jemari kita sebagaimana lazimnya menulis secara konvensional.
Dengan teknologi kegiatan menulis dengan tangan dapat digantikan dengan voice typing (menulis dengan suara) atau lebih populernya dalam istilah penulis adalah menulis dengan mulut (menemu). Penulis karena sudah bertahun-tahun mempraktikkan metode menemu ini sehingga berani mengatakan bahwa menulis itu saking mudahnya bisa semudah menghela nafas. Siapapun yang bisa berbicara, tidak peduli orang itu buta huruf, bahkan orang buta betulan, semuanya pasti bisa menulis.
Pendekatan menulis yang paling penulis sukai adalah menulis dengan pendekatan proses. Ini nanti akan kita bahas khusus. Nah, saat ini kita akan membahas tentang cara menulis mudah dan cepat di Google Docs dengan mesin Speech to Text. Bagaimana caranya? Menulislah dengan suara atau penulis menyebutnya sebagai menemu atau menulis dengan mulut. Istilah ini sangat familiar di dalam implementasi metode Menemu Baling (Menulis dengan mulut dan membaca dengan telinga) yang pernah meraih rekor MURI sebagai metode menulis tercepat terbanyak. Lihat https://terkininews.com/2018/04/16/Mampuono-Menemu-Baling-Piagam-Rekor-MURI-Untuk-IGI.html .
Bagaimana sejarah awal mula dari aktivitas menulis dengan mulut atau suara? Pada era sekitar 71 tahun yang lalu, atau tepatnya pada tahun 1952, sebuah mesin pengenal suara pertama kali ditemukan oleh Bell Laboratories. Alat yang namanya Audrey (automatic digit recognizer) ini mampu mengenali suara dan angka. Alat ini dianggap sebagai nenek moyang dari semua alat yang fungsinya untuk kegiatan menemu atau dalam bahasa Iggrisnya voice typing. Penemuan canggih pada zamannya itu dengan berjalannya waktu terus dikembangkan oleh berbagai perusahaan karena manfaatnya sangat besar. Saat ini mesin-mesin ini sudah banyak sekali jenis dan fitur turunannya. Namanya dikenal sebagai automatic speech response (ASR) atau speech to text (STT).
Dengan STT pengguna dapat mengubah ucapan verbal dalam berbagai bahasa menjadi teks tertulis. STT ini menggunakan algoritma pengenalan suara yang canggih untuk menerjemahkan suara menjadi teks tertulis. Teknologi ini dapat digunakan di berbagai aplikasi dan perangkat, termasuk ponsel, asisten virtual, dan software untuk pengolahan kata. STT dulunya diciptakan untuk orang yang sulit mengetik atau memiliki gangguan tulis-menulis seperti penyandang disabilitas fisik dan lain-lain. Namun, STT sekarang fungsinya menjadi lebih luas, termasuk untuk membantu berliterasi secara cepat dan efektif.
Mesin STT paling mutakhir bahkan terkoneksi dengan jenis pemrograman berbasis data mining, neural network, dan deep learning yang canggih dan sistemnya dibuat seperti pola berpikir manusia. Sentuhan penggunaan artificial intelligence (AI) semakin menyempurnakan cara kerja mesin-mesin ini sehingga kesalahan yang ditimbulkan ketika mengubah suara menjadi text semakin diminimalisir. AI juga membuat program ini bisa mengenali suara seseorang dan melakukan kloning terhadap suara tersebut. Hebatnya, cukup dengan mengetikkan kata-kata, melalui mesin text to speech (TTS) suara yang dihasilkan sangat mirip dengan suara dari pemilik suara yang dikloning. (TTS ini adalah atat utama untuk kegiatan yang disebut Baling atau membaca dengan telinga. Bagian ini akan diulas pada artikel berikutnya).
Dengan STT setiap ucapan yang dimengerti oleh mesin akan langsung diubah menjadi teks pada saat itu juga. Sebuah riset mengatakan bahwa kecepatan menulis dengan cara berbicara ini 10 kali lipat lebih cepat dari menulis konvensional. Dengan cara ini kita dapat menghasilkan berpuluh-puluh paragraf dalam waktu singkat.
Memanfaatkan Google Voice, STT Buatan Google
Saat ini banyak pengembang aplikasi pengubah suara ke teks yang memanfaatkan STT buatan Google. Mesin ini biasanya sudah terinstal di ponsel Android dan memudahkan penggunanya dalam menemu melalui Google Voice. Oleh karena itu penulis menyarankan bahwa hal termudah yang bisa kita lakukan adalah menemu dengan menggunakan aplikasi pengolah kata buatan Google yaitu Google Docs yang sudah terintegrasi dengan Google Voice.
Ini karena aplikasi ini gratis, ukurannya kecil, user friendly, dan bisa berjalan dengan sangat fleksibel pada platform Android, Windows, Macintosh atau operating system lain yang berbasis website, baik di ponsel maupun laptop atau desktop kita. Dengan mengandalkan penyimpanan awan yang berjalan otomatis maka misalnya pekerjaan kita dimulai dari menulis di ponsel dan suatu ketika harus berhenti dan berganti dengan piranti lain, semisal laptop atau desktopm tidak masalah, asalkan masih tersambung dengan internet. Demikian juga sebaliknya. Kalaupun harus bekerja tanpa internet, pengaturan lanjutan juga masih memungkinkan untuk dilakukan.
Bagaimana langkah-langkah yang harus ditempuh untuk cepat dan mudah menulis dengan mulut (menemu) di Google Docs dengan memanfaatkan mesin STT? Hal pertama yang harus kita perhatikan adalah pastikan bahwa di ponsel anda sudah terinstal aplikasi Google Docs. Kalau belum silahkan melakukan instalasi dari Google Playstore dengan klik link ini https://play.google.com/store/apps/details?id=com.google.android.apps.docs.editors.docs . Jika Anda menggunakan laptop/desktop cukup buka akun Google dan mulai membuat file Google Docs yang baru.
Yang kedua pastikan juga bahwa keyboard yang anda gunakan memiliki fasilitas menemu atau voice typing (menemu). Fitur ini biasanya ditandai dengan ikon microphone yang ada di salah satu tombol keyboard. Kadang-kadang microphone itu gambarnya kecil sekali sehingga seperti tersembunyi jadi kita harus cermat untuk memperhatikannya sebelum menggunakan.
Langkah selanjutnya adalah membuka aplikasi Google Docs. User interface Google Docs cukup sederhana, buat orang yang sudah terbiasa menggunakan software semacam Microsoft Word maka mereka sangat familiar dengan fitur-fitur yang ada pada Google Docs. Justru tampilan Google Docs ini jauh lebih sederhana daripada Microsoft Word. Penggunaan telepon genggam atau atau laptop menjadi pilihan yang bisa dilakukan dengan fleksibel. Keuntungannya karena file Google Docs ini disimpan secara online maka pada saat sudah tidak membuka ponsel dan orang bekerja dengan laptop atau desktop maka dengan mudah sekali kita melanjutkan pekerjaan yang sebelumnya sudah dilakukan dengan menggunakan ponsel.
Menemu dengan Ponsel
Jika menggunakan Ponsel Anda juga dapat menemu dengan turunan STT yang oleh Google disebut sebagai Google Voice. Caranya dengan memberdayakan semua keyboard virtual, terutama Google Keyboard, yang menyediakan fitur menemu atau voice typing berbentuk ikon microfon pada perangkat Android Anda dengan langkah-langkah berikut:
- Buka aplikasi Google Docs di ponsel Anda. Pilih File Dokumen baru.
- Ubah ukuran font-nya lebih besar agar nyaman di mata, misalnya ke ukuran 14 atau 16 pixel.
- Klik pada kotak teks untuk membuka keyboard virtual.
- Klik pada ikon mikrofon di sisi kiri atau kanan spasi pada keyboard virtual. Ikonya biasanya berupa gambar mikrofon.
- Bicaralah untuk mengirimkan teks ke aplikasi. Pastikan perangkat Anda terhubung ke jaringan internet yang stabil dan perintah yang diberikan seperti “Titik”, “Koma”, “Enter” dan “Backspace” telah diucapkan dengan jelas.
- Untuk menghentikan menemu, klik pada ikon mikrofon lagi atau cukup katakan “Selesai” atau “Stop”.
- Lakukan edit dan revisi lalu simpan hasil tulisan dengan memilih menu Simpan Sebagai. Jika tidak maka file akan otomatis tersimpan di Google Drive Anda
Setelah selesai, Anda dapat mengedit teks yang ditulis dengan menemu seperti biasa. Pastikan untuk memeriksa teks secara teliti untuk menghindari kesalahan sebelum mengirimkan atau menyimpannya. Perlu diingat bahwa menemu pada Google Keyboard juga dapat mengalami kesalahan atau ketidakakuratan sehingga pengeditan dan revisi setelahnya sangat penting.
Menemu dengan Laptop/Desktop
Jika menggunakan laptop atau desktop Anda dapat menemu dengan menemu atau voice typing di Google Docs dengan mengikuti langkah-langkah berikut:
- Buka Google Docs di browser web Anda.
- Buka dokumen yang ingin Anda tulis dengan menemu atau voice typing.
- Klik pada menu “Tools” di bilah menu di bagian atas halaman, lalu pilih opsi “Menemu atau voice typing” dari menu drop-down.
- Jendela kecil dengan ikon mikrofon berwarna hitam dengan tulisan click to speak di bawahnya akan muncul.
- Pastikan pilihan bahasa Anda sudah benar. Secara default bahasa yang digunakan adalah bahasa Inggris. Untuk menggantinya Anda tinggal klik tombol segitiga hitam kecil di bagian kanan kata English (US) dan memilih bahasa yang akan Anda gunakan.
- Klik pada ikon mikrofon untuk memulai menulis dengan mulut sehingga ikon itu berubah warna merah dengan lingkaran garis merah di sekelilingnya. Apabila mikrofon sudah aktif dan kita berbicara maka warna mikrofon menjadi putih dikelilingi lingkaran berlatar merah, abu-abu dan transparan yang lebih besar di sekelilingnya..
- Mulailah berbicara untuk mengirimkan teks ke dokumen. Pastikan mikrofon Anda diatur dengan benar, dan jangan lupa untuk memberikan perintah seperti “Titik”, “Koma”, “Enter” dan “Backspace” saat diperlukan.
- Untuk menghentikan menemu, klik lagi pada ikon mikrofon.
Setelah selesai, Anda dapat mengedit teks yang ditulis dengan menemu seperti biasa. Perlu diingat bahwa menemu mungkin tidak selalu akurat dan dapat mengalami kesalahan, jadi pastikan untuk memeriksa dokumen Anda dengan teliti sebelum menyimpan atau mempublikasikannya.
Beberapa Faktor yang Perlu Diperhatikan
STT (Speech-to-Text) adalah teknologi yang memungkinkan mesin untuk mengubah ucapan menjadi teks secara otomatis. Dengan menggunakan STT, setiap ucapan yang dimengerti oleh mesin akan langsung diubah menjadi teks dalam waktu nyaris instan. Tentu saja, penggunaan STT dapat mempercepat proses mengetik dan menghasilkan teks dalam jumlah yang lebih besar dalam waktu yang lebih singkat. Riset yang dilakukan penulis dalam disertasinya bahkan menunjukkan bahwa menemu dengan STT ini membuat para pemula menjadi sangat percaya diri karena dalam waktu singkat dapat menuangkan ide-idenya di dalam tulisan. Ini jauh berbeda dari ketika mereka menulis dengan cara konvensional. Jeda antara apa yang dipikirkan dengan produk tulisan yang diketikkan oleh tangan bisa sangat memakan waktu. Namun, ada beberapa faktor yang perlu diperhatikan ketika memutuskan menggunakan STT untuk menemu.
Pertama, meskipun STT semakin akurat, masih ada kesalahan pengenalan suara yang mungkin terjadi. Oleh karena itu, teks yang dihasilkan oleh STT perlu diperiksa dan di edit untuk memastikan akurasi dan kejelasan. Untuk mempermudah, penulis menyarankan melakukan editing melalui kegiatan baling atau membaca dengan telinga, yaitu mengubah teks menjadi suara. Dengan cara ini proses editing tidak melelahkan mata karena cukup mendengarkan artikel dan memperbaiki jika ada yang kurang pas. Ini nanti akan diulas pada artikel berikutnya.
Kedua, penggunaan STT mungkin tidak cocok untuk jenis tulisan tertentu, misalnya yang banyak menggunakan angka dan rumus. Beberapa jenis tulisan, seperti sastra dan puisi yang memerlukan perenungan dan keindahan dari sisi kesusastraan, mungkin memerlukan sentuhan kreatifitas yang tidak bisa spontan dan ini dengan sendirinya sulit dihasilkan oleh mesin.
Ketiga, menggunakan STT juga memerlukan keterampilan berbicara yang baik, lingkungan yang mendukung, jaringan internet, dan peralatan yang memadai. Kualitas teks yang dihasilkan oleh STT sangat tergantung pada akurasi dan kejelasan ucapan. Lingkungan yang lebih tenang dan tidak banyak gangguan suara. atau noise akan membuat suara lebih dapat diterima oleh STT dengan baik. Kuat lemahnya jaringan internet juga turut menentukan kecepatan dan akurasi STT dalam mengubah suara menjadi teks. Peralatan dimana STT terinstal juga harus memadai, artinya kapasitas RAM, CPU, prosesor, atau versi Android dan lain-lain dari peralatan turut menentukan apakah produk akhir berupa teks berkualitas atau tidak.
Jadi dalam hal kecepatan, penggunaan STT dapat meningkatkan produktivitas dalam menulis. Namun, kita masih perlu mencermati kemungkinan kekeliruan yang dilakukan STT dalam mengubah suara kita menjadi teks karena beberapa faktor. Ini penting untuk memastikan kualitas dan akurasi teks yang kita hasilkan jika suatu saat akan dipublikasikan dan menjadi konsumsi banyak orang.
SUMBER BACAAN
- Baran, S. (2011). EBOOK: Introduction to Mass Communication: Media Literacy and Culture. McGraw Hill.
- Choi, J., Gill, H., Ou, S., Song, Y., & Lee, J. (2018, December). Design of voice to text conversion and management program based on Google Cloud Speech API. In 2018 International Conference on Computational Science and Computational Intelligence (CSCI) (pp. 1452-1453). IEEE.
- Connelly, F. M., & Clandinin, D. J. (1990). Stories of experience and narrative inquiry. Educational researcher, 19(5), 2-14.
- Darmaji, D., Mustiningsih, M., & Arifin, I. (2019, December). Quality management education in the industrial revolution era 4.0 and society 5.0. In 5th International Conference on Education and Technology (ICET 2019) (pp. 565-570). Atlantis Press.
- Eggert, P. (1994). Document and Text: The” Life” of the Literary Work and the Capacities of Editing. Text, 1-24.
- Furui, S. (2005). 50 years of progress in speech and speaker recognition research. ECTI Transactions on Computer and Information Technology (ECTI-CIT), 1(2), 64-74.
- Hodder, I. (1994). The interpretation of documents and material culture. Sage biographical research, 1, 393-402.
- Juang, B. H., & Rabiner, L. R. (2005). Automatic speech recognition–a brief history of the technology development. Georgia Institute of Technology. Atlanta Rutgers University and the University of California. Santa Barbara, 1, 67.
- Klimova, B. F. (2012). The importance of writing. Paripex-Indian Journal Of Research, 2(1), 9-11.
- Kurniadi, W., & Mahaputra, M. R. (2021). Determination of Communication in the Organization: Non Verbal, Oral and Written (Literature Review). Journal of Law, Politic and Humanities, 1(4), 164-172.
- Maryanti, N., Rohana, R., & Kristiawan, M. (2020). The principal’s strategy in preparing students ready to face the industrial revolution 4.0. International Journal of Educational Review, 2(1), 54-69.
- Mampuono (2018). Metode Menemu Baling , Menulis dengan Mulut, Membaca dengan Telinga: Cara Guru Merevolusi Budaya Tutur dan Simak Menjadi Budaya Tulis dan Baca. Pontianak: Caremedia
- Mampuono. (2018). 9 Rahasia guru menulis buku dengan metode menemu baling. Jogjakarta: Penerbit IGI Jogjakarta
- Mampuono ‘Menemu Baling ‘ Piagam Rekor MURI Untuk IGI. (April 16, 2018) https://terkininews.com/2018/04/16/Mampuono-Menemu-Baling-Piagam-Rekor-MURI-Untuk-IGI.html
- Mohanty, S. (2011). Syllable based indian language Text-to-Speech system. International Journal of Advances in Engineering & Technology, 1(2), 138.
- Rachmadtullah, R., Yustitia, V., Setiawan, B., Fanny, A. M., Pramulia, P., Susiloningsih, W., … & Ardhian, T. (2020). The challenge of elementary school teachers to encounter superior generation in the 4.0 industrial revolution: Study literature. International Journal of Scientific & Technology Research, 9(4), 1879-1882.
- Thompson, P. (2017). The voice of the past: Oral history. Oxford university press.