Published On: 24 February 2022Categories: Artikel, Artikel Pendidikan

Oleh: Mampuono, S.Pd., M.Kom.

Menulis sebagai bentuk dokumentasi dengan berbagai tujuan telah mengambil peranan sangat penting dalam kehidupan kita. Dengan dokumentasi tertulis itulah informasi diturunkan dari generasi ke generasi. Bahkan, sejarah peradaban manusia dimulai ketika pertama kalinya ditemukan tulisan sebagai dokumen yang ditinggalkan oleh manusia yang hidup di masa sebelumnya.

Tidak diragukan lagi, kebutuhan dokumentasi tertulis dalam hidup kita sangat diperlukan, terlepas dari apapun  profesi kita. Sedemikian pentingnya hal-hal yang terkait dengan tulis-menulis ini bagi kelangsungan hidup manusia, bahkan perintah ketuhanan pun diwujudkan dalam bentuk dokumen tertulis (kitab suci). Mereka yang mempelajari dan menyebarkan konten di dalam kitab suci dengan cara mentransfer pengetahuan melalui bacaan dan tulisan dinisbatkan sebagai orang-orang yang berbuat mulia dan terpuji di hadapan Tuhan. Ini artinya, menulis yang begitu besar manfaatnya dan mendapat penghargaan tinggi  dari Tuhan seharusnya telah menjadi kebutuhan siapapun, dan sudah selayaknya kita berbondong-bondong untuk melakukan aktivitas menulis.

Sayangnya, menulis seringkali dianggap sebagai sebuah pekerjaan yang sulit. Ini karena orang berpikiran bahwa untuk dapat melakukan keterampilan tertinggi dalam berliterasi bahasa itu lazimnya membutuhkan pengetahuan, pemikiran, waktu, dan keahlian  yang memadai. Untuk bisa menghasilkan tulisan orang merasa harus pintar dulu, terpelajar, banyak referensi dan sebagainya. Padahal hal-hal semacam ini bisa dilakukan sambil berjalan. Pepatah yang berlaku adalah alah bisa karena biasa. Semakin terbiasa semakin mudah melakukannya.

Selain adanya kekhawatiran tentang tidak cukupnya pengetahuan, orang juga merasa  harus  cekatan menggerakkan jari jemari untuk mengetik, menuangkan pikiran ke dalam teks. Jadi, hampir dipastikan menulis adalah pekerjaan yang merepotkan bin membosankan, terutama bagi orang-orang yang inginnya praktis dan semuanya serba cepat. Padahal semua hal tersebut dapat diatasi dengan sangat efektif melalui penggunaan teknologi.

Menemu dengan STT

Di era revolusi industri 4.0 ini  teknologi sudah berkembang sangat pesat. Segala sesuatunya dimudahkan dengan adanya kecanggihan teknologi, termasuk dalam menulis.  Kemudahan dalam menulis tersedia lengkap di lingkungan sekitar kita, bahkan yang paling dekat dengan kita, yaitu melalui ponsel. Dan istimewanya kita dapat melakukannya kapanpun dan dimanapun, asal tempatnya tidak bising, hampir tanpa menggerakkan jari-jemari kita sebagaimana lazimnya menulis secara konvensional.

Dengan teknologi kegiatan menulis dengan tangan dapat digantikan dengan voice typing  (menulis dengan suara) atau lebih populernya dalam istilah penulis adalah menulis dengan mulut (menemu).  Penulis karena sudah bertahun-tahun mempraktikkan metode menemu ini sehingga  berani mengatakan bahwa  menulis itu saking mudahnya bisa semudah menghela nafas.  Siapapun yang bisa berbicara, tidak peduli orang itu buta huruf,  bahkan orang buta betulan, semuanya pasti bisa menulis.

Pendekatan menulis yang paling penulis sukai adalah menulis dengan pendekatan proses. Ini nanti akan kita bahas khusus. Nah, saat ini kita akan membahas tentang cara menulis mudah dan cepat di Google Docs dengan mesin Speech to Text. Bagaimana caranya? Menulislah dengan suara atau penulis menyebutnya sebagai menemu atau menulis dengan mulut. Istilah ini sangat familiar di dalam implementasi metode Menemu Baling (Menulis dengan mulut dan membaca dengan telinga) yang pernah meraih rekor MURI sebagai metode menulis tercepat terbanyak. Lihat https://terkininews.com/2018/04/16/Mampuono-Menemu-Baling-Piagam-Rekor-MURI-Untuk-IGI.html .

Bagaimana sejarah awal mula dari aktivitas menulis dengan mulut atau suara?  Pada era   sekitar 71 tahun yang lalu, atau tepatnya pada tahun 1952, sebuah mesin pengenal suara   pertama kali ditemukan oleh Bell Laboratories. Alat yang namanya Audrey (automatic digit recognizer) ini mampu mengenali suara dan angka. Alat ini dianggap  sebagai  nenek moyang dari semua alat yang fungsinya untuk   kegiatan menemu atau dalam bahasa Iggrisnya voice typing. Penemuan canggih pada zamannya itu dengan berjalannya waktu terus dikembangkan oleh berbagai perusahaan karena manfaatnya sangat besar. Saat ini mesin-mesin  ini sudah banyak sekali jenis dan fitur turunannya. Namanya dikenal sebagai  automatic speech response (ASR) atau speech to text (STT).

Dengan STT pengguna dapat mengubah ucapan verbal dalam berbagai bahasa menjadi teks tertulis. STT ini menggunakan algoritma pengenalan suara yang canggih untuk menerjemahkan suara menjadi teks tertulis. Teknologi  ini dapat digunakan di berbagai aplikasi dan perangkat, termasuk ponsel, asisten virtual, dan software untuk pengolahan kata. STT dulunya diciptakan untuk orang yang sulit mengetik atau memiliki gangguan tulis-menulis seperti penyandang disabilitas fisik dan lain-lain. Namun, STT sekarang fungsinya menjadi lebih luas, termasuk untuk membantu  berliterasi secara cepat dan efektif.

Mesin STT paling mutakhir bahkan terkoneksi dengan jenis pemrograman berbasis data miningneural network, dan deep learning yang canggih dan sistemnya dibuat seperti pola berpikir manusia.  Sentuhan penggunaan artificial intelligence (AI) semakin menyempurnakan cara kerja mesin-mesin ini sehingga kesalahan yang ditimbulkan ketika mengubah suara menjadi text semakin diminimalisir.   AI juga membuat program ini bisa mengenali suara seseorang dan melakukan kloning terhadap suara tersebut. Hebatnya,  cukup dengan mengetikkan kata-kata, melalui mesin text to speech (TTS) suara yang dihasilkan sangat mirip dengan suara dari pemilik suara yang dikloning. (TTS ini adalah atat utama untuk kegiatan yang disebut Baling atau membaca dengan telinga. Bagian ini akan diulas pada artikel berikutnya).

Dengan STT  setiap ucapan yang dimengerti oleh mesin akan langsung diubah menjadi teks pada saat itu juga. Sebuah riset mengatakan bahwa kecepatan menulis dengan cara berbicara ini 10 kali lipat lebih cepat dari menulis konvensional. Dengan cara ini kita dapat menghasilkan berpuluh-puluh paragraf dalam waktu singkat.

 

Memanfaatkan Google Voice, STT Buatan Google

Saat ini banyak pengembang aplikasi pengubah suara ke teks yang memanfaatkan STT buatan Google. Mesin ini biasanya sudah terinstal di ponsel Android dan memudahkan penggunanya dalam menemu  melalui Google Voice.  Oleh  karena itu penulis menyarankan bahwa hal  termudah yang bisa kita lakukan adalah menemu  dengan menggunakan aplikasi pengolah kata buatan Google yaitu Google Docs yang sudah terintegrasi dengan Google Voice.

Ini karena aplikasi ini gratis, ukurannya kecil, user friendly, dan  bisa berjalan dengan sangat fleksibel pada platform Android, Windows, Macintosh atau operating system lain yang berbasis website, baik di ponsel maupun  laptop atau desktop kita. Dengan mengandalkan penyimpanan awan yang berjalan otomatis maka misalnya pekerjaan kita dimulai dari menulis di ponsel dan suatu ketika harus berhenti dan berganti dengan piranti lain, semisal laptop atau desktopm tidak masalah, asalkan masih tersambung dengan internet. Demikian juga sebaliknya. Kalaupun  harus bekerja tanpa internet, pengaturan lanjutan juga masih memungkinkan untuk dilakukan.

Bagaimana  langkah-langkah yang harus ditempuh untuk cepat dan mudah menulis dengan mulut (menemu) di Google Docs dengan memanfaatkan mesin STT? Hal pertama yang harus kita perhatikan adalah pastikan bahwa di ponsel anda sudah terinstal aplikasi Google Docs. Kalau belum silahkan melakukan instalasi dari Google Playstore dengan  klik link ini https://play.google.com/store/apps/details?id=com.google.android.apps.docs.editors.docs . Jika Anda menggunakan laptop/desktop cukup buka akun Google dan mulai membuat file Google Docs yang baru.

Yang  kedua pastikan juga bahwa keyboard yang anda gunakan memiliki fasilitas menemu atau voice typing (menemu). Fitur  ini biasanya ditandai dengan ikon microphone yang ada di salah satu tombol keyboard. Kadang-kadang   microphone itu gambarnya kecil sekali sehingga seperti tersembunyi jadi kita harus cermat untuk memperhatikannya sebelum menggunakan.

Langkah selanjutnya adalah  membuka aplikasi Google Docs. User interface Google Docs cukup sederhana, buat orang yang sudah terbiasa menggunakan software semacam Microsoft Word maka mereka sangat familiar dengan fitur-fitur yang ada pada Google Docs.  Justru tampilan Google Docs ini jauh lebih sederhana daripada Microsoft Word. Penggunaan telepon genggam atau atau laptop menjadi pilihan yang bisa dilakukan dengan fleksibel. Keuntungannya karena file Google Docs ini disimpan secara online maka pada saat sudah tidak membuka ponsel dan orang bekerja dengan laptop atau desktop maka dengan mudah sekali kita melanjutkan pekerjaan yang sebelumnya sudah dilakukan dengan menggunakan ponsel.

 

Menemu dengan Ponsel

Jika menggunakan Ponsel Anda juga dapat menemu dengan turunan STT yang oleh Google disebut sebagai Google Voice. Caranya dengan  memberdayakan semua keyboard virtual, terutama Google Keyboard, yang menyediakan fitur menemu atau voice typing berbentuk ikon microfon pada perangkat Android Anda dengan langkah-langkah berikut:

  1. Buka aplikasi Google Docs di ponsel Anda. Pilih File Dokumen baru.

Gambar 1. Memulai membuat file Google Docs baru.

  1. Ubah ukuran font-nya lebih besar  agar nyaman di mata, misalnya ke ukuran 14 atau 16 pixel.
  2. Klik pada kotak teks untuk membuka keyboard virtual.
  3. Klik pada ikon mikrofon di sisi kiri atau kanan spasi pada keyboard virtual. Ikonya biasanya berupa gambar mikrofon.

Gambar 2. Posisi mikrofon di kanan atas pada keyboard virtual Google.

  1. Bicaralah untuk mengirimkan teks ke aplikasi. Pastikan perangkat Anda terhubung ke jaringan internet yang stabil dan perintah yang diberikan seperti “Titik”, “Koma”, “Enter” dan “Backspace” telah diucapkan dengan jelas.

Gambar 3: Posisi Warna ikon mikrofon berubah menjadi putih dan dikelilingi warna biru langit saat sedang aktif mengubah suara menjadi teks.

  1. Untuk menghentikan menemu, klik pada ikon mikrofon lagi atau cukup katakan “Selesai” atau “Stop”.
  2. Lakukan edit dan revisi lalu simpan hasil tulisan dengan memilih menu  Simpan Sebagai. Jika tidak maka file akan otomatis tersimpan di Google Drive Anda
Graphical user interface, text, applicationDescription automatically generated

Gambar 4: Pilihan penyimpanan dan pengiriman ke aplikasi lain.

Setelah selesai, Anda dapat mengedit teks yang ditulis dengan menemu seperti biasa. Pastikan untuk memeriksa teks secara teliti untuk menghindari kesalahan sebelum mengirimkan atau menyimpannya. Perlu diingat bahwa menemu pada Google Keyboard juga dapat mengalami kesalahan atau ketidakakuratan sehingga pengeditan dan revisi setelahnya sangat penting.

 

Menemu dengan Laptop/Desktop

Jika menggunakan laptop atau desktop Anda dapat menemu dengan menemu atau voice typing di Google Docs dengan mengikuti langkah-langkah berikut:

  1. Buka Google Docs di browser web Anda.

                        Gambar 5. Memulai membuka Google Docs dari akun Google.

  1. Buka dokumen yang ingin Anda tulis dengan menemu atau voice typing.
  2. Klik pada menu “Tools” di bilah menu di bagian atas halaman, lalu pilih opsi “Menemu atau voice typing” dari menu drop-down.
  3. Jendela kecil dengan ikon mikrofon berwarna hitam dengan tulisan click to speak di bawahnya akan muncul.

                                         Gambar 6. Memunculkan ikon mikrofon.

  1. Pastikan pilihan bahasa Anda sudah benar. Secara default bahasa yang digunakan adalah bahasa Inggris. Untuk menggantinya Anda tinggal klik tombol segitiga hitam kecil di bagian kanan kata English (US) dan memilih bahasa yang akan Anda gunakan.

                              Gambar 7. Memilih bahasa yang akan digunakan untuk menulis.

  1. Klik pada ikon mikrofon untuk memulai menulis dengan mulut  sehingga ikon itu berubah warna merah dengan lingkaran garis merah di sekelilingnya. Apabila mikrofon sudah aktif dan kita berbicara maka warna mikrofon menjadi putih dikelilingi  lingkaran berlatar merah, abu-abu dan transparan yang  lebih besar di sekelilingnya..

           Gambar 7. Mikrofon aktif siap menerima suara (kiri) dan mikrofon sedang menerima suara (kanan).

  1. Mulailah berbicara untuk mengirimkan teks ke dokumen. Pastikan mikrofon Anda diatur dengan benar, dan jangan lupa untuk memberikan perintah seperti “Titik”, “Koma”, “Enter” dan “Backspace” saat diperlukan.
  2. Untuk menghentikan menemu, klik lagi pada ikon mikrofon.

Setelah selesai, Anda dapat mengedit teks yang ditulis dengan menemu seperti biasa. Perlu diingat bahwa menemu mungkin tidak selalu akurat dan dapat mengalami kesalahan, jadi pastikan untuk memeriksa dokumen Anda dengan teliti sebelum menyimpan atau mempublikasikannya.

Beberapa Faktor yang Perlu Diperhatikan

STT (Speech-to-Text) adalah teknologi yang memungkinkan mesin untuk mengubah ucapan menjadi teks secara otomatis. Dengan menggunakan STT, setiap ucapan yang dimengerti oleh mesin akan langsung diubah menjadi teks dalam waktu nyaris instan. Tentu saja, penggunaan STT dapat mempercepat proses mengetik dan menghasilkan teks dalam jumlah yang lebih besar dalam waktu yang lebih singkat. Riset yang dilakukan penulis dalam disertasinya bahkan menunjukkan bahwa menemu dengan STT ini membuat para pemula menjadi sangat percaya diri karena dalam waktu singkat dapat menuangkan ide-idenya di dalam tulisan. Ini jauh berbeda dari ketika mereka menulis dengan cara konvensional. Jeda antara apa yang dipikirkan dengan produk tulisan yang diketikkan oleh tangan bisa sangat memakan waktu. Namun, ada beberapa faktor yang perlu diperhatikan ketika memutuskan menggunakan STT untuk menemu.

Pertama, meskipun STT semakin akurat, masih ada kesalahan pengenalan suara yang mungkin terjadi. Oleh karena itu, teks yang dihasilkan oleh STT perlu diperiksa dan di edit untuk memastikan akurasi dan kejelasan. Untuk mempermudah, penulis menyarankan melakukan editing melalui kegiatan baling atau membaca dengan telinga, yaitu mengubah teks menjadi suara. Dengan cara ini proses editing tidak melelahkan mata karena cukup mendengarkan artikel dan memperbaiki jika ada yang kurang pas. Ini nanti akan diulas pada artikel berikutnya.

Kedua, penggunaan STT mungkin tidak cocok untuk jenis tulisan tertentu, misalnya yang banyak menggunakan angka dan rumus. Beberapa jenis tulisan, seperti sastra dan puisi yang memerlukan perenungan dan keindahan dari sisi kesusastraan, mungkin memerlukan sentuhan kreatifitas yang tidak bisa spontan dan ini dengan sendirinya  sulit dihasilkan oleh mesin.

Ketiga, menggunakan STT juga memerlukan keterampilan berbicara yang baik, lingkungan yang mendukung, jaringan internet, dan peralatan yang memadai. Kualitas teks yang dihasilkan oleh STT sangat tergantung pada akurasi dan kejelasan ucapan. Lingkungan yang lebih tenang dan  tidak banyak gangguan suara. atau noise akan membuat suara lebih dapat diterima oleh STT dengan baik. Kuat lemahnya jaringan internet juga turut menentukan kecepatan dan akurasi STT dalam mengubah suara menjadi teks. Peralatan dimana STT terinstal juga harus  memadai, artinya kapasitas RAM, CPU, prosesor, atau versi Android dan lain-lain dari peralatan turut menentukan apakah produk akhir berupa teks berkualitas atau tidak.

Jadi dalam hal kecepatan, penggunaan STT dapat meningkatkan produktivitas dalam menulis. Namun, kita  masih perlu mencermati kemungkinan kekeliruan yang dilakukan STT dalam mengubah suara kita menjadi teks karena beberapa faktor. Ini penting  untuk memastikan kualitas dan akurasi teks yang kita hasilkan jika suatu saat akan dipublikasikan dan menjadi konsumsi banyak orang. 

 

SUMBER BACAAN

  • Baran, S. (2011). EBOOK: Introduction to Mass Communication: Media Literacy and Culture. McGraw Hill.
  • Choi, J., Gill, H., Ou, S., Song, Y., & Lee, J. (2018, December). Design of voice to text conversion and management program based on Google Cloud Speech API. In 2018 International Conference on Computational Science and Computational Intelligence (CSCI) (pp. 1452-1453). IEEE.
  • Connelly, F. M., & Clandinin, D. J. (1990). Stories of experience and narrative inquiry. Educational researcher19(5), 2-14.
  • Darmaji, D., Mustiningsih, M., & Arifin, I. (2019, December). Quality management education in the industrial revolution era 4.0 and society 5.0. In 5th International Conference on Education and Technology (ICET 2019) (pp. 565-570). Atlantis Press.
  • Eggert, P. (1994). Document and Text: The” Life” of the Literary Work and the Capacities of Editing. Text, 1-24.
  • Furui, S. (2005). 50 years of progress in speech and speaker recognition research. ECTI Transactions on Computer and Information Technology (ECTI-CIT)1(2), 64-74.
  • Hodder, I. (1994). The interpretation of documents and material culture. Sage biographical research1, 393-402.
  • Juang, B. H., & Rabiner, L. R. (2005). Automatic speech recognition–a brief history of the technology development. Georgia Institute of Technology. Atlanta Rutgers University and the University of California. Santa Barbara1, 67.
  • Klimova, B. F. (2012). The importance of writing. Paripex-Indian Journal Of Research2(1), 9-11.
  • Kurniadi, W., & Mahaputra, M. R. (2021). Determination of Communication in the Organization: Non Verbal, Oral and Written (Literature Review). Journal of Law, Politic and Humanities1(4), 164-172.
  • Maryanti, N., Rohana, R., & Kristiawan, M. (2020). The principal’s strategy in preparing students ready to face the industrial revolution 4.0. International Journal of Educational Review2(1), 54-69.
  • Mampuono (2018). Metode Menemu Baling , Menulis dengan Mulut, Membaca dengan Telinga: Cara Guru Merevolusi Budaya Tutur dan Simak Menjadi Budaya Tulis dan Baca. Pontianak: Caremedia
  • Mampuono. (2018). 9 Rahasia guru menulis buku dengan metode menemu baling. Jogjakarta: Penerbit IGI Jogjakarta
  • Mampuono ‘Menemu Baling ‘ Piagam Rekor MURI Untuk IGI. (April 16, 2018) https://terkininews.com/2018/04/16/Mampuono-Menemu-Baling-Piagam-Rekor-MURI-Untuk-IGI.html 
  • Mohanty, S. (2011). Syllable based indian language Text-to-Speech system. International Journal of Advances in Engineering & Technology, 1(2), 138.
  • Rachmadtullah, R., Yustitia, V., Setiawan, B., Fanny, A. M., Pramulia, P., Susiloningsih, W., … & Ardhian, T. (2020). The challenge of elementary school teachers to encounter superior generation in the 4.0 industrial revolution: Study literature. International Journal of Scientific & Technology Research9(4), 1879-1882.
  • Thompson, P. (2017). The voice of the past: Oral history. Oxford university press.