Ses interfeýsleri we kömekçiler
1) VUI näme we haçan zerur
Ses interfeýsi (VUI) - söz arkaly özara gatnaşyklaryň usuly: programmada/brauzerde kömekçiler, akylly sütünler, IVR/telefoniýa, awtoulagda we telewizorda ses.
El bilen işleýän ssenariler (sürmek, aşhana), çalt toparlar ("açyň"..., "jaň ediň"...), elýeterlilik, çylşyrymly menýu boýunça nawigasiýa üçin amatlydyr.
Aşakdakylar üçin amatly däl: takyk wizual saýlamak (kataloglar, tablisalar), ekransyz gurluş maglumatlarynyň uzak wagtlap girizilmegi.
2) Gepleşik modeli: intentler, mazmun we kontekst
Intent (maksat): Ulanyjynyň isleýän zady: "_ Töleg", "Balansyny barlaň".
Slotlary/mazmuny: maksat parametrleri: jemi, walýuta, adresat, senesi.
Kontekst/dialog-state: nämäni bilýäris, nirede şahalaşýandygymyzy anyklaýarys.
Tassyklamak düzgünleri: nämäni aç-açan tassyklaýarys (pul, şahsy maglumatlar).
json
{
"intent": "MakeDeposit",
"slots": {
"amount": {"type": "number", "required": true, "confirm": "sensitive"},
"currency": {"type": "currency", "required": true, "default": "UAH"},
"method": {"type": "payment_method", "required": false}
}
}
3) Gepleşik patternleri
1. Topar bir söz bilen: "Apple Pay 500 griwniýa hasaby dolduryň". → tassyklama → hereket.
2. "Kime terjime etmeli?" → "Haýsy mukdarda?" → tassyklama.
3. Ädimme-ädim ussat: maglumatlary barlamak we yzyna ädim ätmek bilen çylşyrymly ssenariler.
4. Niýeti tanamak + NLU-söz: dürli formulalary goldamak.
5. Çalt maglumatlar: "Çykarmak üçin haýsy çäklendirmeler bar?" - gysga jogap + "Ekranda görkezmek".
4) Formulalar: ses we äheň
Markanyň sesi: ynamly, asuda, dostlukly; kritiki ädimlerde kemsidiji we "degişmesiz" (tölegler, howpsuzlyk).
Maks. kömekçiniň sözleriniň uzynlygy: 1-2 teklip; uzyn jogaplar - döwmek we "Dowam etmek?"
Anyk soraglar: "Haýsy mukdarda doldurmaly?" "Indiki näme edýäris?"
5) Tassyklamalar, howpsuzlyk we ahlak
Duýgur hereketleri berk tassyklamak: esasy parametrleri aýtmak ("500 griwniýa kartoçka bilen doldurmak... 4581? »)
Yzyna gaýtaryp bolmajak amallar üçin goşa tassyklama.
Doly şahsy maglumatlary aýtmazdan.
Ýatyrmak/yzyna gaýtarmak mümkinçiligi: "Ýatyrmak", "Togtatmak", "Soňky ädimi ýatyrmak".
6) Ýalňyşlyklar we düşünişmezlikler
Şowsuzlyklaryň görnüşleri we jogaplar:- ASR ýalňyşlygy (eşitmedim): "Mukdary eşitmedim. Haýyş edýärin"
- NLU-düşnüksiz: "Haýyşa düşünmedim. Hasabymy dolduryp ýa-da balansymy görkezip bilerin. Näme saýlarsyňyz?"
- Maglumat ýok/çäklendirme: "Bu usul sebitiňizde elýeterli däl. Beýleki wariantlary aýtmak?"
- Tor/hyzmat: "Häzirki wagtda töleg hyzmaty bilen baglanyşyk ýok. Bir minutdan soň gaýtalamak?"
Düzgün: iň köp 2 synanyşyk → alternatiwa hödürlemek (ekrana/adama).
7) Tizlik we barj-in (kesmek)
TTFB gizlinligi: maksat <300-500 ms; uzyn bolsa - gysga "em-mm" - signal/earcon.
Barge-in: ulanyjy kömekçini islendik pursatda kesip biler; kesmegi dogry ýerine ýetirýäris.
Jogap akymlary: Ähli tekst taýýar bolmanka, manysyz gürleşip başlaýarys.
8) TTS/ASR we SSML: nädip "adamkärçilikli" diýmeli
Sanlaryň/walýutalaryň/seneleriň aýdylyşy: ýerli formatlar ("bäş ýüz griwniýa", "15 ýaprak düşýär").
Arakesmeler: SSML '<break time = "300ms "/>', '<emphasis level =" moderate ">'.
Gysgaltmalary/kodlary okamak: '<say-as interpret-as = "characters"> IBAN </say-as>'.
Tizlik we tembr: 0-dan çalt däl. 9 × düşnükli bolar ýaly esasy.
xml
<speak>
Top up on <say-as interpret-as = "cardinal"> 500 </say-as>
<sub alias = "hryvnia"> UAH </sub>?
<break time="300ms"/>
Please confirm.
</speak>
9) Multimodallyk: ses + ekran
Wizual maslahatlar: tassyklama kartoçkasy, usullaryň sanawy, ösüş.
Hand-off: "Men wariantlary ekrana iberdim. Usuly saýlaň"
Ýagdaýy sinhronlamak: ses başlaýar, ekran tamamlaýar (we tersine).
10) Köp dillilik we lokalizasiýa
Bir söz bilen däl-de, sessiýa/sazlama boýunça dili awtomatiki kesgitlemek.
Terminleriň sözlügi: RU/UA/TR/EN üçin ýeke-täk terminologiýa.
Sanlaryň/walýutalaryň/seneleriň sebitleýin formatlary, atlaryň/toponimleriň aýdylyşy.
"Ukrain diline geçmek" dialogyna geçmek - aýdyň buýruk.
11) Sesde elýeterlilik (A11y)
Hereketleri tassyklamak - aýdyň we gysga.
Islege görä gaýtalamak: "Gaýtalamak" iň soňky sözleri aýdýar.
Ses/tizlik: "Has haýal/has haýal/has güýçli gürläň".
Eşidiş ukyby pes adamlar üçin: subtitrler/ekrandaky transkript, wibro-signallar.
Çykyşyň bozulmagy üçin: girizmegiň alternatiw usullary (düwme, presetler).
12) Gizlinlik, logika we gabat gelmek
Wake-word we ýazgy görkezijisi: aç-açan "diňleýärin" ýagdaýy.
Mümkin bolsa ýerli gaýtadan işlemek; ýogsam - maglumatlary azaltmak.
Loglarda duýgur bölekleri gizlemek (PAN, IBAN, salgy) we ses awto redaksiýasy.
Saklamak möhletleri we talap boýunça aýyrmaga bolan hukuk; "Taryhy saklamaň" sazlamasy.
Ýaş çäklendirmeleri/ene-atanyň gözegçiligi (çagalaryň sesleri/toparlary).
Aç-açanlyk: "Bu buýrugy tanamagy gowulandyrmak üçin ýazýaryn. Sazlamalarda öçürip bolýar"
13) Kömekçiniň şahsyýeti
Ady/şahsyýeti: gysga terjimehaly, başarýan/bilmeýän başarnyk ugry.
Ýagdaýlaryň äheňi: adaty (dostlukly), kritiki (bitarap), öwrediji (goldaýan).
Serhetler: "Men maliýe maslahatyny bermeýärin, ýöne şahadatnama görkezip bilerin."
14) VUI hil ölçegleri
Intent recognition rate (NLU takyklygy).
Slot fill rate и avg. turns to fill.
ASR WER/CER (söz/nyşan tanamakda ýalňyşlyk).
Task Success / Completion rate и Time-to-Complete.
Escalation rate (operatora/ekrana).
Barge-in usage и Latency p95.
Ulanyjy Satisfaction/CSAT ssenariden soň.
Ädimde abandonment.
15) Sesi barlamak we QA
Synag sözlemleriniň toplumy: sinonimler, gepleşik görnüşleri, aksentler, ýalňyşlyklar.
Gurşawyň sesleri: köçe/awto/aşhana, dürli mikrofonlar.
Gepleşik-repleýler: gaýtalanýan ssenariler, regressiýa üçin golden-set.
Wizard-of-Oz başlangyç döwürde.
Hukuk ssenarileri: kömekçiniň potensial howply haýyşlara nähili jogap berýändigi.
16) Önüm bilen integrasiýa (iGaming-cases)
Balans/goýum/aýyrmak: "Haýsy balans? ", "200 UAH bilen doldurmak"..., "Netijäniň ýagdaýy".
Bonuslar/missiýalar: "Haýsy bonuslar elýeterlidir? ", "Bir hepdelik nagt puly işjeňleşdiriň".
Jogapkär oýun: "Hepdede 1000 UAH goýum çägini belläň."
Ulgamlaryň ýagdaýy: "Häzirki wagtda tehniki işler barmy?"
17) Anti-patternler
Kömekçiniň uzyn monologlaryny kesip bolmaýar.
Pul amallarynyň aç-açan tassyklamalary.
Alternatiwasyz "düşünmedim".
Duýmaga päsgel berýän artykmaç sesler/jinglalar.
Jikme-jik wizual saýlama zerur bolan meseleleri "ses" bilen çözmäge synanyşmak.
18) Promtlaryň we jogaplaryň şablonlary
Sloty takyklamak (jemi):- Kömekçi: "Hasaby näçe mukdarda doldurmaly?"
- Ulanyjy: "Bäş ýüz."
- Kömekçi: "500 griwniýa dolmak? Tassyklaň"
- "500 griwniýa kartoçka bilen doldurylandygyny tassyklaň... 4581. "Tassyklaýaryn" ýa-da "ýatyrmak" diýiň"
- "Töleg usulyny eşitmedim. Teklip edip bilerin: Apple Pay, kart, kripto gapjygy. Näme saýlarsyňyz?"
- "Bar bolan usullary ekrana iberdim. Dowam etmek üçin "taýýar" diýiň"
19) SSML patternleriniň mysallary
Sanlar/walýuta we arakesme:xml
<speak>
Your current balance is
<say-as interpret-as="cardinal">1250</say-as>
<sub alias = "hryvnia"> UAH </sub>.
<break time="250ms"/>
Shall we continue?
</speak>
Möhüm söze üns:
xml
<speak>
<emphasis level = "moderate "> Caution </emphasis>: Verification is required for output.
</speak>
Gysgaltma:
xml
<speak>
Recharge with <say-as interpret-as = "characters"> IBAN </say-as>?
</speak>
20) Çek-listler
Çykmazdan ozal gepleşik/mazmun
- Her bir intent üçin - sinonimleriň/söz görnüşleriniň sanawy.
- Her bir hökmany slot üçin - bir anyk sorag.
- Duýgur hereketler - aç-açan tassyklamak bilen.
- Ekrana gysga alternatiwa/" operator "bar.
- Teklipleriň ≤ 2-si; uzyn - "Dowam etmek? ».
Tehnikasy we hili
- Kesilenden soň barge-in we dialoga gaýdyp gelmek goldanyldy.
- Gizlinlik p95 kadaly; gijikdirilende earcons bar.
- SSML sazlandy: arakesmeler, sanlar, urmalar.
- Loglar şahsylaşdyrylmady/gizlendi; taryhy dolandyrmak bar.
- Köp dillilik we ýerli formatlar barlandy.
A11y we howpsuzlyk
- "Gaýtalamak/Has haýal/Has güýçli gürlemek" işleýär.
- Doly şahsy/töleg maglumatlary aýdylmaýar.
- Sesiň ýatyrylmagy/yzyna gaýtarylmagy bar.
- Ýaş we sebit çäklendirmeleri barlandy.
21) Dialogyň aýratynlyklarynyň çarçuwasy (şablon)
Ssenariýanyň maksady: (mysal üçin, "Depozit ≤ 90 sek")
Ententler we sinonimler: söz düzümleriniň sanawy.
Слоты: `amount` (req, confirm), `currency` (default=UAH), `method` (enum).
Tassyklamalaryň düzgünleri: haýsy manylar/bosagalar üçin gaýtalamak talap edilýär.
Hata wariantlary: ASR, NLU, hyzmat ýok - tekst + şahalar.
Multimodal çykyş: haýsy kartoçkalary/ekranlary görkezýäris.
Giriş we gizlinlik: nämäni we nädip gizleýäris, TTL saklamak.
Jemleýji şpargalka
Ilki intentler/slotlar/tassyklama düzgünleri, soň tekstler.
Gysgaça gürläň, kesmäge we ýatyrmaga rugsat beriň.
SSML, ýerli formatlary we äheňleri kontekste sazlaň.
Gizlinligi we logirlemegi gözegçilik astynda saklaň.
Intent/Slot/ASR metriklerini, Task Success we gizlinligi ölçäň.
Elmydama ekrana alternatiwaňyz we adama barýan ýoluňyz bar.