SKRIPSI DIGITAL
Retina: Wearable Assistive Device Berbasis Model Vision-Language Sebagai Alat Bantu Visual Bagi Tunanetra = Retina: A Wearable Assistive Device Based on Vision-Language Model as a Visual Aid for the Visually Impaired
Orang dengan gangguan penglihatan sering menghadapi batasan signifikan dalam berinteraksi secara holistik dengan lingkungan sosial, yang dapat menghambat kemandirian dan partisipasi mereka. Untuk mengatasi tantangan ini, penelitian ini memperkenalkan RETINA, perangkat Internet of Things (IoT) yang dapat dikenakan (wearable), yang dirancang khusus untuk membantu orang dengan gangguan penglihatan memahami situasi dan kondisi sekitar mereka secara real-time. Perangkat ini dibangun menggunakan mikrokontroler ESP32-S3 dan mengintegrasikan beberapa model kecerdasan buatan. Untuk fitur perintah suara, RETINA menggunakan model 1D-CNN dengan MaxPooling, yang menunjukkan kinerja unggul dengan validation accuracy 96,67%, F1-Score 95,56%, Precision 95,80%, dan Recall 95,43%. Pengenalan suara diimplementasikan menggunakan model Whisper-Tiny yang telah disesuaikan, berhasil mencapai tingkat kesalahan kata (Word Error Rate) sebesar 13,652%, yang memungkinkan interaksi suara yang akurat. Selain itu, untuk interpretasi dan pemahaman kondisi lingkungan, perangkat mengintegrasikan SmolVLM-500M sebagai model visi-bahasa (VLM). Model ini telah disesuaikan menggunakan metode LoRA (Low-Rank Adaptation) dan dikompresi secara signifikan, mengurangi ukuran file dari 2GB menjadi 405MB. Hal ini memungkinkan operasi efisien pada memori GPU terbatas tanpa mengorbankan kinerja. Selain itu, SmolVLM-500M mengungguli model-model VLM yang jauh lebih besar seperti Qwen-VL 9B, InstructBLIP 7B, dan Janus 1.3B pada beberapa benchmark Visual Question Answering (VQA). Oleh karena itu, RETINA menawarkan solusi inovatif dan efektif untuk meningkatkan interaksi dan kemandirian individu dengan gangguan penglihatan dalam lingkungan sosial mereka.
Tidak tersedia versi lain