Gå til innhold
  • Bli medlem
Støtt hjemmeautomasjon.no!

Tore Andre Rosander

Medlemmer
  • Innlegg

    113
  • Ble med

  • Besøkte siden sist

  • Dager vunnet

    5

Innlegg skrevet av Tore Andre Rosander

  1. 16 hours ago, Moskus said:

    Som du sier er akustikk viktig. Men etterklangstiden i en typisk stue ligger vanligvis rundt 0,5-0,7 sekunder, så SÅ lang er ikke klangen. Med flere mikrofoner har man flere valg med signalbehandling for å få et enda bedre signal. Dette kunne vi snakket mye om men det hjelper ikke på problemstillingen. ;) 

     

    Men mikrofonvalget er ikke uviktig (uansett hva noen påstår). Man kan ikke programmere seg bort fra en dårlig mikrofon, eller; det er i det minste ganske vanskelig. Webkameraer er f.eks. stort sett laget for å ikke plukke opp for mye bakgrunnstøy og lyd på lang avstand, nettopp fordi personen som bruker dem vanligvis sitter rett foran PCen. ;)


    Takk for mange innspill, når det kommer til utsagnet om at det er software det stopper så vil jeg tro at det gjelder når du har en OK + mikrofon koblet til.
    I mitt tilfelle så skal Eye kameraet i teorien være nok. Men det er jo ett poeng i det @Lazarus sier om SDK-er for jeg vil tro at en del av arbeidet foregår på programvaresiden og at det er nettopp her programvaren er en flaskehals.

    Men er det noen har som har tips til hva slags hotword som er mest unikt og samtidig ikke helt idiotisk å rope ut i stuen?

    Grunnen til at jeg ønsker å kjøre DIY er at det er utrolig enkelt å lage moduler til feks Jasper. Har 2 unger på 3 og 5 år, så i tillegg til at jenta på 5 skal kunne styre en del av husets smarte funksjoner skal jeg også lage en robot til de, har de fleste delene til roboten liggende og har testet funksjonene hver for seg men jeg mangler bare en god stemmestyring for å knytte alt sammen.

  2. For min del så tar jeg bussen daglig så den ville blitt brukt til det formålet, men hadde uansett vært gøy å fått det til som ett proof of concept.

    Har sendt en ny mail direkte til Nettbuss for å prøve å fiske etter litt informasjon.
    Jeg ser på svaret jeg fikk fra Agder Kollektivtrafikk sist at de hadde videresendt det til utviklerne av mobilappen så mest sannsynlig har de ikke skjønt hva jeg spurte om.
     

  3. 16 minutter siden, Moskus skrev:

    Mikrofonvalg vil være vesentlig. Hvilken bruker du?

     

    Alexa og Google Home har begge gode mikrofoner og ganske så hissig DSP for å filtrere bort bakgrunnstøy og forbedre det nødvendige talesignalet. Jeg er mer imponert at du får bra nok tale på 2-3 meter avstand, jeg. :) 

     

    I følge utvikleren bak Jasper er det software det står på og ikke hardware når det kommer til DIY oppsett av stemmestyring/gjenkjenning.
    Først brukte jeg ett gammelt creative webkamera, men jeg driver å tester Sony sitt Eye kamera til PS3 som har 4 mikrofoner som skal fungere ganske bra til formålet.
    Det fungerer greit og er plug and play i linux men er usikker på om den faktisk benytter alle 4 mikrofonene.

    Men behøver ikke nødvendigvis så aggressiv filtrering av støy, men jeg synes den bør oppfatte en stemme med litt autoritet fra 4-5 meter i ett stille rom.

    Jeg tenkte også å teste en linux installasjon på en vanlig desktop for å se om det er raspberry-en som er flaskehalsen.

     

    Jeg tipper akustikk og slikt også spiller en liten rolle når det kommer til hvor godt programvaren oppfatter stemmene når man ikke støy filtrering e.l (jeg aner ikke om jasper benytter seg av slikt).
     

  4. 42 minutes ago, Salvesen said:

     

    Jeg har også tenkt på dette, men jeg er usikker på hva som skjer når jeg kloner det over. Vill jo ha mer enn bare en ting. Prøvde å dra på busstasjonen for å kjøpe busskort men få de til å registerere chip i steden. Men det var såklart ikke noe slikt lengre, alt skjer på nett. 

     

    Har også sett at folk har brukt sas kortet sitt, håper å få inn mitt også etterhvert. 

     

    Ja, jeg vil tro du må klone kortet. Det er jo 2 mulige oppsett, enten er det en unik ID på kortet som lese i bussen, og når du fyller på kortet så skrives dette i en database til busselskapet som alle kortleserne er koblet opp mot.
    Eller så skrives informasjonen direkte til kortet og lagres der.

    Jeg vet at ett kort ikke kan brukes 2 ganger i løpet av 5 minutter så det må jo være en database som holder styr på bruken.
     jeg vil tro at man kan slenge frem hånda når man skal fylle opp og bruke kortet så lenge man får klonet det 100%.

    Du kan kun ha 1 funksjon på implantatet ditt, jeg ser at flere har 2-3 stk for å dekke flere funksjoner.

  5. Man kan også få satt inn slike hos BioNyfiken i sverige, de holder ofte medlems kvelder hvor de setter implantater (det koster litt mer enn å bare bestille selv).

    Men det jeg lurer på er om det er mulig å klone ett kontaktløst busskort (fra nettbuss sør), har prøvd å fiske ut informasjon fra nettbuss selv men jeg tror ikke de forstod hva jeg mente når jeg sa at jeg skulle sette rfid/nfc implantat i hånden eller så vil de ikke at folk skal begynne å grave i teknologien de bruker.

    Jeg ser at SAS sitt kort kan klones, også inngangskort til SATS kan klones.

    Om noen har en kortleser liggende og vil prøve å lese ett busskort så kan jeg mer enn gjerne sende ett i posten.

  6. Har samme spørsmål liggende på nFF, men får nok flere svar her inne tenker jeg.

    Har i dag en Raspberry Pi med Jasper som stemmegjenkjenning og det fungerer ok om man sitter opptil 2 meter fra mikrofonen men den sliter fortsatt litt med bakgrunnstøy og feiltolkning, dette kan kanskje komme av sørlandsdialekten min selv om jeg prøver å uttale ordene på ren bokmål.
    Det virker også som at hele Jasper prosjektet sjangler litt både i form av dårlig dokumentasjon og lite strukturert community. 

    Jeg skjønner jo også at valget mitt om å bruke Norsk istedenfor engelsk spiller en liten rolle i selve gjenkjenningen. Bruker wit.ai som STT og Ivona med den Norske stemmen Liv som TTS.

    Har satt sammen ett par moduler på Norsk som bla gjør at jenteungen på 5 år kan starte spillelister fra mediasenteret i stuen og styre en del smarthus funksjoner uten at hun trenger å inn i kontrollpanelet å begynne å rote.

    I starten brukte jeg ett gammelt creative webkamera som kun funket opptil 1 meter fra mikrofonen. Byttet til PS3 Eye camera pga mikrofonspesifikasjonene og økte distansen med en god meter.

     

    Det jeg sliter mest med er stemmegjenkjenning fra 2-3 meter og oppover.

    Er det noen her som bruker lignende programvare og har noen anbefalinger?

    Og hva vil dere anbefale som hotword? Har prøvd litt forskjellig som "Hei robot" som ofte tolkes som "Hei robert" og "Hei robåt", jeg har også testet Alexa som hotword men det tolkes ofte som "alex/aleks".

     

    Hvilket Norsk ord er det mest unike man kan bruke som samtidig ikke høres skikkelig kleint ut når man roper det ut mens man har folk på besøk?

     

    Har kikket på Alexa til raspberry pi men der må man trykke en knapp for å snakke til mikrofonen, dette kan sikkert løses med "ekstern" hotword detection programvare som simulerer en bryter på GPIO pinnene, men har ikke kikket noe nærmere på det.

    Jeg har også ett nettbrett hengende på kjøkkenet med "OK google" og tasker som jeg kan bruke til samme formål men dette funker heller ikke veldig bra (kan hende det er mikrofonen i nettbrettet som er dårlig).

    Google home og Alexa dot fra Amazon er jo gode alternativer sett fra ett hardware perspektiv, men ønsker å sette sammen noe selv da jeg har litt store planer for systemet på sikt.

  7. Hva om du bruker 2 separate "Set" blokker under hverandre

    If bla bla bla..
    Do "Set varmeovn pc = on"

          "Set Varmeovn Vindu = on"

     

    Istedenfor
    If bla bla bla.. 
    "set varmeovn PC AND Varmeovn vindu = on"?

  8. 1 hour ago, Hilmar said:

     


    Nei, den så interessant ut. Skal testes :)



    Tror ikke jeg kan skylde på RPi, for den spiller ikkeav lyden, bare tilbyr nedlasring av mp3 til Chromecasten.

     


    Men den sender/streamer vel filen ut til chromecasten. "Hei chromecast, ta denne filen".
    Jeg kan hvertfall reprodusere den samme buggen på både RPi 2 og Zero når jeg spiller av korte snutter som små setninger. Uten å vite nøyaktig hva som er problemet så virker det som at RPi-ene starter lydfilen før den klarer å starte opp 3.5mm utgangen, nå vet ikke jeg om det er samme bug du opplever siden du sender lyden via nettverket.

    Det er flere som har samme problem med lyd avspilling på RPi (både debian og ubuntu) og det har vært nevnt flere ganger i forumene til domoticz.

    Fant faktisk en løsning mens jeg lette etter kilder:
    http://unix.stackexchange.com/questions/184684/audio-play-not-starting-at-beginning

    http://askubuntu.com/questions/218444/sound-output-starts-delayed


     

  9. @Hilmar har du sett på iZsynth? Det er ett "standalone" script som automatisk henter ned TTS filer rett fra kommandolinjen. 

    Denne kommandoen spiller feks av lyden med 90% volum " izsynth -W 90 -t "Can you hear me now?" "

    Du kan også bruke ett stort utvalg av TTS-er (både online og offline), Ivona har feks god støtte for Norsk språk.
     

    https://github.com/ugoviti/izsynth

    http://www.domoticz.com/wiki/IzSynth

     

    Quote

    Det hender at lyden kommer på midt i det andre ordet i setningen, f.eks.


    Dette er faktisk ett kjent problem med avspilling av korte setninger fra en Raspberry Pi og gjelder ikke kun chromecast.

  10. Har du kjøpt den? Står det i såfall noe om produsent?
    Vil tippe dette er ett OEM produkt som selges under flere merker.

    Du kan evt bruke en pakkesniffer så kan du se hva slags informasjon som går frem og tilbake, om det er JSON vil det i utgangspunktet være en smal sak å integrere dette i domoticz.

×
×
  • Opprett ny...

Viktig informasjon

Vi har plassert informasjonskapsler/cookies på din enhet for å gjøre denne siden bedre. Du kan justere dine innstillinger for informasjonskapsler, ellers vil vi anta at dette er ok for deg.