網頁標題: NVDA 字詞解式的顯示方式之一或,共有11則留言


  

〔版子#1〕Bo-Cheng Jhan,民國105年4月16日(星期六)11點58分

    ; 逗號
這個前面的符號,我讀起來是「分號」耶?

  

〔版子#2〕天呀,民國105年5月4日(星期三)16點59分

啊!我終於搞董,為啥不能直接在 notepad++ 搜尋問號(?)了?

  

〔版子#3〕in mind,民國105年5月6日(星期五)9點31分

NVDA 點字顯示的問題:
有些符號或者文字的點字顯示方式,會隨著游標是否停在此處而有不同?
例如 tab 這個符號,當游標停在該符號時,會顯示「二四七八點」,游標離開該處,就變成空白;也會有相反的狀況,游標不再該處,才會顯示「二四七八點」,停在該處則顯示為空白?不知這是怎樣設定的?
有些破音字詞的點字顯示方式也有類似這樣的狀況,例如「音樂」這個詞,,該二字的前後假如均為空白,才會正確顯示為『音月』,否則會變成「音」『快樂的樂」,
深入探索的話也許會發現,「游標是否在這個破音字慈」,會有不同顯示方式,而所謂的「字詞」,是根據該詞前後是否有空白,及英文的一個「單字」而言,
所以請看看下面這兩個句子的差異:
一,「今天我好 快樂 的玩 音樂」,
二,「今天我好快樂的玩音樂」,
使用 NVDA 你有發現啥不一樣嗎?第二個句子由於都沒有空白,NVDA 把它當作是一個「單字」了,但對中文來說其實就是一個句子。
我有時挺矛盾這樣處理究竟好還是不好?因為太完美的處理,視障生就不曉得有破音字這種東西存在,我自己就一職到長大才知道有這東西的,當以當我忽然發現「樂」這個字有兩種發音,簡直非常訝異!。
但你是否還會發現,根據我上面桌,「音樂」與「快樂」,「快樂」、「喜悅」,則無論是否為一個詞(前後都有空白),就都不會搞錯,但其實「喜月」(音發月亮的月)跟「喜樂」,在意境上有些不同,起碼小時候我們看聖經都只有「喜樂」這個詞,比較獄友宗教意涵吧?
使用語音朗讀遇到破音字詞的時候,使用游標上下鍵跟左右見的讀音也常有不同。
以上,我知道許多表達不明之處,請有興趣的自己理解,有空我在做比較精細的剖析吧!

  

〔版子#4〕go crazy,民國105年5月6日(星期五)11點26分

我用的 notepad++ 應該是舊版免安裝的那種,功能有限吧?ALT 檔案功能表往右,並沒有找到編碼這個東西,而且他的搜尋功能實在夠糟!按 CTRL+F 會自動將游標所在行貼到搜尋對話視窗,點字摸起來會讓我誤以為發生了啥事的樣子!
搜尋某字串時非得把「Regular expression  核取方塊  勾選」才行,我以為只是因為搜尋問號的時候,因為它是特殊字元才需要那樣做,搞不懂為啥連搜尋普通字串也得那樣,不是挺麻煩嗎?
我喜歡免安裝版軟體,主要因為嚕它可以隨身攜帶,不過看來很多時候免安裝版軟體其實不好用的。
想找 vim,可是 gvim NVDA 無法操,按方向鍵找不到游標,也摸不到朗案內容,在 CMD 模式下適用 vim  倒是還蠻好用的,但我要打中文的時候就會很討厭的麻煩唉!
甄試的,為了完成工作,我得花大量時間搞清楚一大堆邊儀器操作方式,不能單純一點用一個工具就能完成大部分的工作嗎?人類把資訊搞得那樣複雜,真是見鬼了!

  

〔版子#5〕Sponge Jhan,民國105年5月6日(星期五)18點58分

in mind 剖析的相當詳細,兩個句子音樂的「樂」顯示行為並不一樣。
NVDA 看起來確以「空白」當成斷字依據,「空白」包含半形空白、換行與 Tab. 奇怪的是全形空白並不被當成斷字依據!
這種斷字、斷詞行為對亞洲語言如中文、日文相當不利,但是反觀自然語言處理當前的技術,對付中日韓等語言並無法 100%, 只不過導盲鼠系列真的用中文斷詞方式解析中文,所以破音字處理上較得宜。
日本人的 NVDA 是自創專案的,好像叫 NVDAJP, 其中可能就包含斷詞處理。
至於「做太完美以致於不知道破音字存在」,我想不必擔心,學校老師都會教導,我們改進技術就只要朝向完美努力,視障生董不懂破音字就留給站長笑笑哥與其他老師傷腦筋吧!

  

〔版子#6〕天子,民國105年5月7日(星期六)7點25分

我比較覺得 能看得懂,閱讀的時候能比較容易理解文意或辭意,應該更重要,知道有破音字也許也很重要,但對視障生來說
恐怕是否能在月盧過程學習知識,會更重要吧?不曉得導盲鼠究竟怎樣處理中文,雖然不是百分百正確,但許多破音字場合都
能正確顯示,語音跟點字雖然有時也有錯誤顯示現象,反觀 NVDA,據說花了好多錢,申請好多一畫,卻仍很難克服這些問題
嗎?

  

〔版子#7〕Sponge Jhan,民國105年5月7日(星期六)15點21分

我說說我的感想,其實 NVDA 或許多螢幕報讀軟體,就是要把資訊用語音、點字呈現,但其中的轉換是人腦定義的,這就是「自然語言處理」的領域。目前的自然語言處理,我覺得仍然很封閉在自己的語言,看看當下所有語音引擎,都只針對一個語言處理,外加因為美國強大而全球通用的英文,可是其實別種語言的語音引擎唸英文都很不標準。點字也是相同狀況,現在 liblouis 的點字表,幾乎也每個語言各自為政,選了中文點字那就別想摸到日文假名。前幾個討論的「斷詞」問題更是困難,論文上超多種斷詞方法,科技是不斷前進的,然而,每種亞洲語言有自己的特質,不是哪種斷詞演算法能完美對付所有亞洲語言,大家有自己當前表現最出色的演算法。其實「斷詞」應該是 liblouis 專案的事情,不完全是 NVDA 要管,可是我不清楚 liblouis 裡面是否有懂自然語言處理的專家在貢獻,我相信因此日本人如果把自己的點字只用點字表的方式呈現,有超多漢字轉假名或者特殊場合要變音的狀況根本處理不來,就跟上面幾樓抱怨的破音字一樣!如果要求 liblouis 從點字轉換表的「字典」對應方式改成會斷詞,會有兩個困難:1. 人加底層的資料結構要重大調整,這種事情我幹過,令人有強烈無力感,因為不能改幾行就測試一下,要全部改完才能面對跑出來當掉的事實!2. 「斷詞」經常很依賴權後紋,前後文 (context) 需要更複雜的語言模形如 n-gram 來處理,整體而言就是一堆統計資料放著讓程式依據數據內容挑選最佳斷詞結果,這些語言模型的統計資料跟點字「完全無關」,而且通常體積很龐大,人類的活動本就是 Big Data, 這樣大的資料要是跟著 liblouis 散發到世界各地,每個語言都有自己的模型數據,我電腦上就會有很多別種語言的數據我又用不到,下場不是專案安裝成本加重就是下載安裝過程變複雜。最後是一個 NVDA 研究者發起的問卷,看起來內容有關亞洲世界的 NVDA 論壇,它在請教亞洲人 NVDA 使用狀況,以及如果要成立 NVDA 亞洲的團體,有怎樣意見?有興趣的人可以協助填答。

    NVDACon Non Visual Desktop Access screen reader Users and Developers Conference for South Asian regions

題目簡述如下:真實姓名 (What is your full name?)請在下方提供電郵與其他連絡方式 (Please provide your e-mail address below and any other contact information.)問視力損失程度 (Are you visually impaired? If so, what is the level of your visual impairment?)問使用的螢幕報讀軟體 (Which screen reader(s) do you use on your Windows computer? You can choose more than one option in case you use certain alternatives are secondary choices, or only for testing or research purposes.) 複選,導盲鼠的可勾其他然後自己寫問使用 NVDA 的目的 (For what tasks and in what environments do you use or have used NVDA? You can choose more than one option in case you use NVDA in a variety of settings.)問操作 NVDA 的程度 (How proficient are you in the usage of NVDA?) 選項初、中、進階問有沒有關心、加入國際 NVDA 論壇 (Are you aware of NVDA conferences for its users and developers held internationally annually and have you participated in one?)要是加入亞洲的 NVDA 論壇,你想幹麻 (How interested would you be in an NVDA conference for South Asian regions, namely NVDACon SA, similar to regional NVDA conferences such as NVDACon KR, NVDACon JP, NVDACon US etc?) 也是問你想擔任的角色要是有亞洲 NVDA 的論壇,希望使用何種語言 (If an NVDACon South Asia does come to life, what should be the preferred language for communication in the conference?)線上論壇的平台該用什麼 (What online conferencing platform should the conference be based?)最下面是申論題,寫下對 NVDA 的感覺,你覺得這種亞洲論壇為何要存在?以及你希望在裡面見到的討論內容?

  

〔版子#8〕笑笑鴿,民國105年5月8日(星期天)11點26分

有關 symbols.dic 定義,其實我也還有點疑惑的,
為何只有前面幾個半形符號定義,其餘的還有更多的半形符號沒定義,而只針對這幾個,實在難以理解?事實上沒有被定
義道的半形符號還是可以被念出來的,
開啟檔案就會看到這幾行:(我把好奇的問題標住在下面這幾行內容景字號之後)
symbols: # 除了一開始使用 "symbols" 這個單字,不知是否還有其他單字可作為什麼定義?而這些定義的意義又是
啥?也迥是說,"symbols:" 在這裡是什麼意思?
  全形空格 all # 雖然在這裡特別定義權型空格我能理解,但半型空格就沒有定義了,我猜如果沒有定義「辦
行」空格,是不是按空白鍵,NVDA 的朗讀就是 space 了嗎?所以假如我希望按空白件它會念「空白」這兩個字,我就得
在這個檔案嘉義定義嗎?
\r 航尾 char # char 所代表的是什麼?整個檔案也只有這個 char
negative number 負 # 這一行的定義,我很不能理解,我原本以為是不是由標移到這個片語(或者都辭)它會如同英文
翻譯中文那樣朗讀「負」這個字,然而我游標移動到 "negative number" 這個片語,NVDA 卻並沒有朗讀「負」這個
字,於是我又異想天開地定義了「computer 電腦」,但這樣的定義也沒任何作用,(反而由標移到 computer 之
後就根本也不念了),那請問這行定義的用意就逕為合?
( 半形左括號 most # 多數的半型常用的符號都沒有在這個檔案被定義,那麼目前定義的這幾個符號,是
由誰來決定的?誰決定該定義哪些符號?而這些符號又該被訂一些啥稱呼方式?依據的是什麼?都很令人感到好奇!
) 半形右括號 most # 所以請教我是否能這樣理解,如果沒有在這個檔案定義的半形符號,均會以英文來
朗讀,至少 : 這個符號因為沒有被定義所以就念英文啦!
! 半形驚歎號 all # 於是我靈機一動,增加了冒號與分號兩個符號定義×,讓小朋友在進行數學題目輸入
的時候更能聽得懂自己打的是啥?以方便自我檢查。
? 半形問號 all # 我覺得應該把「辦形」這兩個字拿掉,看看效果如何?
· 間隔號 most # 這個符號的店為跟小數點一樣都是「四六點」,感覺不大理想,我會在日後關於點字定義做
這方面討論。

總而言之是不是在這個檔案裡頭增加「加減乘除」這四個數學運算子,還有等於符號,至少四則運算就能使用了嗎?最起
碼它可以定義中文朗讀。

  

〔版子#9〕zgn_aonf,民國105年5月10日(星期二)16點50分

可不可以將大陸與香港的字詞解是檔案,去掉重複的部分,與台灣的合併成一個檔案?

  

〔版子#10〕Sponge Jhan,民國105年5月11日(星期三)16點36分

    就我知道的發表如下:
半形符號,沒定義的會從 en 找,所以聽到都英文。
symbols: 這用來宣告下面的區段屬於定義單一符號的唸法,這檔案只有兩種區段,另一個是 complexSymbols, 宣告下面是正規表達式的仳配而不是單一符號。NVDA 不讓用戶自己定義正規表達式,用 NVDA 自訂只能改單一符號部份。
按空白鍵要唸「空白」,這建議有興趣的用戶可以嘗試,也許定義鍵盤讀法跟符號讀法是分離的。
negative number 也要看 en 的 symbols.dic, 它是一個正規表達式,仳配到數字之前的減號,這樣當朗讀 -123 才會讀「負」。
所有半形符號我也不把握誰有決定權,但很可能是連大人都聽不習慣英文只好左斜用中文,還有這檔案修訂者的立場是預設讀者遇到全形的機會較大,因此全形不唸形狀,半形特別唸「半形」。
「間隔號」外觀如同小數點,位置也一樣,這是對岸用法,台灣標準間隔號是置中的,但是 Wikipedia 等多數網頁都採用大陸寫法,因此當初我只好建議以這符號當「間隔號」,間隔號主要用於外來語如人地名間的斷音。點字 46 極可能也跟外形有關。
總之,可在 symbols.dic 定義加減乘除看看,測試就對了別想太多,電腦的世界裡電腦說了算!
Python 的能力可以把三地 symbols.dic 合併,技術也非常簡單,只要會寫判斷、迴圈,以及讀寫檔跟 dict 資料結構操作,就可以輕鬆達成。

  

〔版子#11〕笑笑鴿,民國105年5月11日(星期三)19點57分

其他的我需要找時間消化一下呵!謝謝!先來說一下我發現的「空白建」的定義方式,居然有兩種:
一 一開始就先按個跳格符號,然後接著定義「空白」,
二,另一種則是先按個空白符號,然後再按跳格符號,最後定義「空白」兩個字。
不曉得這兩種定義方式有啥差別?我實在測試不出來!
另外我覺得之前的導盲鼠可以把「空白」與空行」了朗讀方式做區隔,如此究竟游標停留的位置究竟是空白行或者只是單純的一個空格,很容易分辨,NVDA 不知有沒有這種定義,但我在鹿港兩地的符號定義表有發現反斜線後面家數字玲的定義,懷懷疑就是那個,但不確定。
「為啥我的 NVDA 語音朗讀「接著」會念成「接住」(住宅的住),?這語音朗讀修改方式怎樣改定義,還請大家指點!謝謝!
對了,語音的標點符號停頓的方式實在聽起來很不習慣?有許多標點符號幾乎聽不出有停頓的感覺。


閱讀文章〈NVDA 字詞解式的顯示方式之一或〉 ---點閱次數 1 回前伊個頁面:也可以直接案倒退鍵唷!