Φωνητικός έλεγχος
σχεδιασμένος για προσβασιμότητα.

Αντικατάστησε πληκτρολόγιο και ποντίκι με τη φωνή σου. Η εφαρμογή σου επιτρέπει να ελέγχεις τα βασικά του Windows, να ανοίγεις εφαρμογές και να εκτελείς καθημερινές ενέργειες μόνο με απλές φωνητικές εντολές – με έμφαση στην προσβασιμότητα και την ευκολία χρήσης.

Speech recognition (Google / Azure / Whisper) Custom Tkinter UI Εστίαση στην προσβασιμότητα Αναπτυγμένο σε Python

Σχετικά με την εφαρμογή

Η εφαρμογή Voice Control Assistant είναι ένα εργαλείο φωνητικού ελέγχου για Windows, που επιτρέπει στον χρήστη να εκτελεί βασικές ενέργειες όπως άνοιγμα εφαρμογών, κίνηση του ποντικιού, κύλιση, ρύθμιση έντασης και χειρισμό παραθύρων, χρησιμοποιώντας μόνο φωνητικές εντολές.

Στόχος της εφαρμογής είναι να διευκολύνει την καθημερινή χρήση του υπολογιστή, ιδιαίτερα για άτομα με κινητικές δυσκολίες ή χρήστες που προτιμούν hands-free αλληλεπίδραση. Μέσα από απλές εντολές στα ελληνικά, ο χρήστης μπορεί να ελέγχει βασικές λειτουργίες χωρίς να χρειάζεται πληκτρολόγιο ή ποντίκι.

Η εφαρμογή αναπτύχθηκε με έμφαση στην προσβασιμότητα, την απλότητα και την επεκτασιμότητα. Ο χρήστης μπορεί να ενεργοποιεί ή να απενεργοποιεί τη σίγαση, να ελέγχει αν καταγράφεται το ιστορικό εντολών, καθώς και να προσαρμόζει ποιες εφαρμογές θα ανοίγουν με συγκεκριμένες φωνητικές εντολές.

Τεχνολογικά βασίζεται σε Python, βιβλιοθήκες αναγνώρισης ομιλίας (Google, Azure, Whisper), και μια προσαρμοσμένη διεπαφή CustomTkinter. Η αρχιτεκτονική της εφαρμογής επιτρέπει μελλοντικές επεκτάσεις, όπως προσθήκη νέων εντολών, επιπλέον μοντέλων φωνής ή βελτιωμένων εργαλείων αναφοράς προβλημάτων.

Ιστορικό εκδόσεων & Τεχνολογίες

Τρέχουσα έκδοση: v1.0 – Stable Release. Παρακάτω φαίνονται οι τελευταίες αλλαγές και οι βασικές τεχνολογίες που χρησιμοποιήθηκαν στην ανάπτυξη της εφαρμογής.

v1.0 – Stable Release

Η πρώτη σταθερή έκδοση της εφαρμογής μετά τη φάση beta, με βελτιώσεις στη σταθερότητα, την προσβασιμότητα και τη συνολική εμπειρία χρήσης.

  • Ενημέρωση UI μετά την απενεργοποίηση φωνητικών εντολών: Τα κουμπιά κατάστασης (σίγαση, ενεργό, απενεργοποίηση) συγχρονίζονται σωστά με την πραγματική κατάσταση του voice control, ώστε ο χρήστης να έχει καθαρή οπτική εικόνα.
  • Προσθήκη worker thread για TTS: Η μετατροπή κειμένου σε ομιλία (TTS) εκτελείται πλέον σε ξεχωριστό worker thread, ώστε να μην "κολλάει" η διεπαφή κατά την αναπαραγωγή φωνητικών επιβεβαιώσεων.
  • Κουμπί διαγραφής ιστορικού: Προστέθηκε κουμπί «Διαγραφή ιστορικού» που καθαρίζει το αρχείο recognized_command.txt και την προβολή στο UI, δίνοντας στον χρήστη καλύτερο έλεγχο πάνω στα αποθηκευμένα logs.
  • Tooltips & ελληνικά alias για εντολές: Προστέθηκαν επεξηγηματικά tooltips στα βασικά στοιχεία της διεπαφής και ελληνικά alias για ορισμένες φωνητικές εντολές, ώστε η χρήση να είναι πιο φιλική και κατανοητή.
  • Ευθυγράμμιση κουμπιών & κύρια παράθυρα: Βελτιώθηκε η στοίχιση των κουμπιών στη βασική φόρμα και ρυθμίστηκαν τα παράθυρα ώστε να ανοίγουν ως κύρια (primary), προσφέροντας πιο καθαρή και συνεπή εμπειρία χρήσης.
  • Πρώτα tooltips στη διαχείριση εφαρμογών: Προστέθηκαν τα πρώτα βοηθητικά tooltips στην περιοχή διαχείρισης εφαρμογών, ώστε ο χρήστης να καταλαβαίνει καλύτερα τη λειτουργία κάθε επιλογής (π.χ. προσθήκη, διαγραφή, μετονομασία).

Συχνές ερωτήσεις (FAQ)

Μερικές βασικές πληροφορίες για την εφαρμογή, τον σκοπό της και την πολιτική δεδομένων.

Τι είναι το Voice Control Assistant;

Το Voice Control Assistant είναι μια εφαρμογή για Windows που επιτρέπει τον έλεγχο του υπολογιστή με φωνητικές εντολές στα ελληνικά. Μπορείς να ανοίγεις εφαρμογές, να κινείς τον δείκτη του ποντικιού, να κάνεις κύλιση, να ρυθμίζεις την ένταση, να διαχειρίζεσαι παράθυρα και πολλά άλλα χωρίς χρήση πληκτρολογίου ή ποντικιού.

Πρόκειται για εμπορική εφαρμογή;

Όχι. Η εφαρμογή αποτελεί μέρος πτυχιακής εργασίας στο Τμήμα Πληροφορικής του Διεθνούς Πανεπιστημίου της Ελλάδος και είναι καθαρά μη κερδοσκοπική. Στόχος είναι η έρευνα και η υποστήριξη ατόμων με ειδικές ανάγκες, όχι η εμπορική αξιοποίηση.

Τι δεδομένα συλλέγει η εφαρμογή;

Η ίδια η εφαρμογή δεν αποθηκεύει ή στέλνει προσωπικά δεδομένα σε κάποιον δικό μου server. Το μόνο που μπορεί να καταγραφεί τοπικά είναι:

  • το ιστορικό φωνητικών εντολών (σε απλό αρχείο κειμένου), αν η επιλογή είναι ενεργή,
  • οι βασικές ρυθμίσεις της εφαρμογής (π.χ. μοντέλο φωνής, κατάσταση σίγασης).

Δεν γίνεται συλλογή στοιχείων ταυτότητας, επαφών, κωδικών ή άλλων ευαίσθητων δεδομένων από εμένα. Οτιδήποτε αποθηκεύεται, μένει τοπικά στον υπολογιστή του χρήστη.

Ποιοι πάροχοι επεξεργάζονται τη φωνή μου;

Η επεξεργασία φωνής (αναγνώριση ομιλίας και, όπου χρησιμοποιείται, μετατροπή κειμένου σε φωνή) γίνεται μέσω εξωτερικών υπηρεσιών, όπως:

  • Google Speech Services,
  • Microsoft Azure Speech,
  • μοντέλα τύπου Whisper / OpenAI, όπου αυτό υποστηρίζεται.

Τα σχετικά ηχητικά δεδομένα αποστέλλονται στους αντίστοιχους παρόχους αποκλειστικά για τον σκοπό της αναγνώρισης φωνής και υπόκεινται στους όρους χρήσης και τις πολιτικές απορρήτου των εταιρειών αυτών.

Συλλέγω εγώ προσωπικά δεδομένα από τους χρήστες;

Όχι. Δεν λειτουργεί κανένας προσωπικός server συλλογής δεδομένων. Δεν τηρώ βάση δεδομένων με στοιχεία χρηστών, emails ή καταγραφές φωνής. Η μόνη εξαίρεση είναι αν ο χρήστης επιλέξει ο ίδιος να στείλει αναφορά προβλήματος μέσω της φόρμας Google Forms, όπου τα στοιχεία που συμπληρώνονται (π.χ. email, περιγραφή) αποθηκεύονται ασφαλώς στον λογαριασμό μου για σκοπούς υποστήριξης και βελτίωσης της εφαρμογής.

Σε ποιους απευθύνεται η εφαρμογή;

Η εφαρμογή σχεδιάστηκε κυρίως για άτομα με κινητικές δυσκολίες ή χρήστες που δυσκολεύονται να χρησιμοποιήσουν πληκτρολόγιο και ποντίκι. Παρ’ όλα αυτά, μπορεί να φανεί χρήσιμη σε οποιονδήποτε θέλει να δοκιμάσει φωνητικό έλεγχο του υπολογιστή του.

Χρειάζεται σύνδεση στο διαδίκτυο;

Ναι, για τα online μοντέλα φωνής (όπως Google και Azure) απαιτείται ενεργή σύνδεση στο διαδίκτυο, ώστε να σταλεί ο ήχος για επεξεργασία. Χωρίς σύνδεση, οι αντίστοιχες φωνητικές λειτουργίες δεν θα λειτουργούν.

Μπορώ να απενεργοποιήσω τη φωνητική αναγνώριση;

Ναι. Υπάρχουν ξεχωριστές καταστάσεις λειτουργίας, όπως κανονική λειτουργία, σίγαση (mute) και πλήρης απενεργοποίηση της ακρόασης. Έτσι μπορείς να σταματήσεις προσωρινά ή μόνιμα τη λήψη και επεξεργασία εντολών, ανάλογα με τις ανάγκες σου.

Υπάρχει κάποιο κόστος για τον χρήστη;

Όχι, η εφαρμογή διανέμεται δωρεάν στο πλαίσιο πτυχιακής εργασίας και δεν έχει οποιοδήποτε εμπορικό ή συνδρομητικό μοντέλο. Ο μόνος ενδεχόμενος περιορισμός αφορά τυχόν όρια χρήσης από τις ίδιες τις πλατφόρμες φωνητικής αναγνώρισης (Google, Azure, OpenAI κ.λπ.).