فهرست مطالب:

Sistem De Conversație Bazat Pe Inteligență Artificială: 6 مرحله
Sistem De Conversație Bazat Pe Inteligență Artificială: 6 مرحله

تصویری: Sistem De Conversație Bazat Pe Inteligență Artificială: 6 مرحله

تصویری: Sistem De Conversație Bazat Pe Inteligență Artificială: 6 مرحله
تصویری: КАК НАСТРОИТЬ L4D2 2024, نوامبر
Anonim
Sistem De Conversație Bazat Pe Inteligență Artificială
Sistem De Conversație Bazat Pe Inteligență Artificială

نویسنده: Stanut Nicolae-Radu

گروه: 333AB

یادداشت: 8

مرحله 1: توصیف کارکرد

Descriere Funcțională
Descriere Funcțională

principn principiu sistemul va fi asemănător

asistenților inteligenți pentru casă de tipul Google Assistant و Amazon Alexa ، استفاده از ابزارهای پیش فرض برای استفاده از این ابزار ، استفاده از آنها در صورت استفاده از خدمات ، و همچنین استفاده از آنها. Creierul acestui مقررات و فای تمشک pi 3 ، dptit faptului că dispune de Wi-Fi ، acest lucru permițând conectarea la serviciul cloud Amazon، care va da "inteligență" sistemului.

با استفاده از ابر در هوش مصنوعی در آمازون ، می توانید از خدمات و عملکرد عملی آمازون Alexa استفاده کنید. به عنوان مثال ، می توانید از طریق مجازی ، به عنوان یک منبع کوچک ، به عنوان یک کارخانه کوچک ، به عنوان یک کارخانه دیگر ، به طور کامل از آمازون ، به طور کامل از دستگاه ها استفاده کنید.

Ca și obiectiv secundar، voi încerca să integrez limba română astfel încât asistentul să poată înțelege و comenzi dei de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asistentul s ajute la automatizarea unor processe، de exemplu aprinderea و stingerea unor lumini، oprirea unei Prize. Desigur، doar dacă API-ul Amazon va permite aceste lucruri.

Sursa poză:

مرحله 2: سازگاری

Pentru realizarea proiectului am avut nevoie de următoarele components:

  1. تمشک PI 3 B+

    مینی رایانه را می توان با استفاده از سیستم عامل Linux ، Debian pe un procesor ARM ، به منظور ایجاد تغییرات بیشتر در سیستم عامل خود ، ایجاد کرد. Asemenea، acest model dispune și de wi-fi، conexiunea la internet fiind absolute necesară pentru motoarele de text-în-vorbire și vorbire-în-text

  2. PS چشم دوربین

    Pe post microfon ("urechea proiectului") am ales o cameră destinată consolei Play Station 3 deoarece dispune de un microfon puternic cu 4 canale، fiind mai ieftină decât o cameră web obișnuită

  3. جعبهă قابل حملă

    Pentru a transmite informația către utilizator a fost nevoie de un difuzor، am folosit o boxă cu fir primită de la un prieten

  4. 2 آتش + LED
  5. کازرولă

    Carcasa proiectului، o caserolă de sarmale: D

مرحله 3: سخت افزار

سخت افزار
سخت افزار

După ce am adunat component، am trecut la implementare، schema este una foarte simpleă. Boxa portabilă se conectează la portul USB pentru alimentare și la portul jack pentru playback، camera/microfonul sear contectează doar la portul USB prin care comunică cu computer-ul. Am mai adăugat în schemă ledi led-ul conectat la pin-ul 17 cu rezistorul، pentru comanda de lumină. عارضه نیمیکی

مرحله 4: نرم افزار

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator (voce)، să transforme datele într-un format accesibil lui (متن) ăi să le redea răspunsul sau confirmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii جداگانه:

  1. Un motor Speech-to-Text (STT) ، pentru a prelua datele de intrare (انتقال اطلاعات از استفاده کننده prin vorbire)
  2. Un sistem de inteligență artificialță ، pentru a lua decizii و a rezolva problem
  3. Un motor Text-to-Speech (TTS) ، pentru a transmite utilizatorului răspunsurile sau confirmările acțiunilor

Pentru STT am folosit API-de de Google ، denumit Google Speech API ، مراقبت رایگان ، به طور معمول از طریق ارتقاء سطح انرژی ، به طور مکرر ، می توانید تعداد زیادی از برنامه ها را محدود کنید. Am ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori cei cea mai supusă la perturbații. سخت افزار محدود کننده سخت افزار impuse de computer (putere de processare، spațiu de stocare، memorie)، folosirea unui serviciu offline este exclusive only، așa că am optat pentru un serviciu Cloud، oferind și o precizie mai mare، dar și un timp de răn Google având unul dintre cele mai bune motoare STT.

Pentru feedback-ul oferit utilizatorului (TTS-ul) am ales un motor offline، deoarece acesta nu este foarte mare konsumator de resurse și nici no este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Speech Synthesis System ، مراقبت از خدمات رایگان از زیرمجموعه های MIT. Vocea esta una ușor robotică ، dar mult mai inteligibilă față de eSpeak ، alt motor TTS آفلاین است. Avantajul său față de serviciile online este că nu are niciun fel de limitare la numărul de coversii.

Liantul dintre STT și TTS، precum and partea "iteligentă" este platforma denumită Jasper. O platformă Open Source ، disponibilă pe GitHub la link-ul: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus și ia decizii în funcție de input-ul utilizatorului. Este compatibilă cu Raspberry PI، fiind scrisă în Python. من می توانم از کلرهای مخرب در سیستم عامل ابری استفاده کنم ، از طریق STT و TTS ، به عنوان یک برنامه کاربردی پهنای باند ، می توان از برنامه های Python استفاده کرد.

سیستم های اطلاعاتی مصنوعی از روشهای غیرقابل قبول هستند ، من می توانم انواع مختلف آنها را در سیستم های آسیب رسان یاد بگیرم (chatbot) بعنوان مثال ، نمی توان به طور غیرقانونی به آن اشاره کرد. Natura platformei Jasper، fiind bazată pe comenzi și acțiuni predefinite، limitează capacitatea de convorbire، dar oferăn cadru potrivit pentru un asistent digital، acesta fiind și scopul proiectului.

مرحله 5: پیاده سازی

  1. در سیستم عامل Raspbian pe cardul microSD نصب شده است
  2. am conectat camera și difuzorul la Raspberry
  3. Am configurat sistemul de operare، după care am instalat toate bibliotecile and servisiile necesare، urmând toți pașii din acest ghid:
  4. Am creat și instalat module adiționale pentru a extinde funcționalitatea sistemului

مرحله 6: استفاده کنید

Image
Image
استفاده کنید
استفاده کنید
استفاده کنید
استفاده کنید

با استفاده از مانیتور دستگاه ، می توانید تنظیمات اولیه و پیش فرض وایرلس را تنظیم کرده و کنترل SSH را انجام دهید. Jasper permite două tipuri de interacțiune:

  1. ترمینال پرینت (متن) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jasper

برای ساده سازی راه های ارتباطی بین ترمینال ها La rularea comenzii jasper_cli va fi afișat un mesaj de întâmpinare، iar Jasper este gata să primească comenzi. Printre comenzile cunoscute se numără:

  • DEFINE + cuvânt - întoarce defininiția din dicționar a cuvântului respectiv
  • WHO، WHAT، HOWCH، MOWCH، HOW OLD + cuvânt - folosește API -ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - folosește API -ul de la wikipedia pentru a oferi informații despre diferite noțiuni
  • JOKE - spune o glumă
  • LUMOS/NOX - aprinde/stinge LED -ul atașat
  • TRIVIA
  • MOVIES - informații despre filme (imdb)
  • اخبار - citește știri

modn modul voce، deschis la معرفی comenzii "jasper" in linia de comandă، dispozitivul se pune in modul de așteptare، acesta fiind trezit la auzirea unui cuvânt-cheie. cn cazul de față cuvâtul cheie este "Jasper". După ce dispozitivul auzit cuvântul cheie، acesta intră în modul de ascultare، putând să primească comenzi دقیقاً در این مورد در متن متن. După exerearea comenzii، dispozitivul intră din nou în așteptare până la o nouă trezire a sa.

توصیه شده: