W. J. T. Mitchell, 陳永國. 影像學. ISBN: 978-7-301-31142-4
當初買這本書的時候是看這本書叫“影像學”以為是講圖形影像處理基礎理論的,買下之后才發現是講哲學的,其中涉及的很多術語我都沒見過,所以這本書實際上沒看懂,但錢都花了,就硬著頭皮讀了下來,
雖然這本書是講哲學的,但由于好歹涉及“影像”所以多少還是有一些關于影像的內容,所以,可以說這本書和影像處理的主題有一些關系,但又沒什么直接關系,這些若有若無的關系就是這本書中也討論了影像的性質和意義等話題,讓人驚異的是,一些哲學家似乎并沒有影像處理的背景,但憑借哲學化的分析,竟然得出了一些令人折服的洞見,例如書中提到的貢布里希對影像輪廓的分析:
常常有人說輪廓是一種習俗,因為我們環境中的物體不受線條的束縛……然而,把輪廓看作習俗的傳統觀點是以一種過分簡化為基礎的,我們環境中的物體,實際上清楚地與其環境相脫離,至少當我們一開始運動時它們就脫離了,輪廓就相當于這種經驗,(出自:Gombrich, "Image and Code: Scope and Limits of Conventionalism in Pictorial Representation", in Image and Code.)
對于這個觀點,我想不少做自然影像分割的人都會認同,有時候真是不得不感嘆,搞哲學的這幫人到底咋想出來的,
當然了,這本書雖然涉及一點影像處理的話題,卻并不以影像處理為主要論述物件,其主線其實是影像和語言的對立,書中把視覺的,直觀的,二維的,空間的,感性的,繪畫的影像和聽覺的,抽象的,一維的,時間的,理性的,詩歌的語言對立起來,討論二者的性質和關聯,對于這個宏大的話題,由于我實在是不懂所以也沒法做啥評價,不過書中把語言和聽覺關聯顯然還是受表音語言的影響太深,實際上一門語言也可以借助非聽覺的形式,甚至借助影像的形式而存在,所以把語言與聽覺系結似乎不夠本質,可能把語言與理性思維、邏輯思維關聯更加合理,因為一方面純粹的語言不一定得是聲音的,而是來自思維的;另一方面,聲音雖然看不見,但它本身其實也是一種“形象”,
最后分享一個讀這本書時看到的一個對影像處理很有啟發的點,在影像處理領域,圖形學解決的是從語言到形象的問題,影像學解決的是從形象到語言的問題,做這兩方面研究的時候,人們總是不經意間默認影像和語言之間存在可轉換性,這本書中提到了這樣一種疑問:難道影像和語言之間真的能做完美的轉化么?雖然理論上基于貝塞爾曲線的圖形學方程可以無限近似任何一種自然場景下的影像,但同樣的資訊以方程的形式給出和以影像的形式給出,對于觀者來說真的一樣么?
對于一個沒有經過圖形影像處理訓練的人來說,僅憑直覺判斷,他的回答或許是“不一樣”,因為方程和曲線圖形看起來就不同,但對于完整學習了資訊論、概率論、信號處理、數字影像處理、圖形學等知識的人來說,他的回答卻可能是“一樣”,因為曲線方程和曲線圖形這兩種形式蘊含的資訊量是完全相同的,對于這些受過訓練而回答“一樣”的人來說,他們或許忽略了一個至關重要的點——接受曲線方程或曲線影像資訊的是人,人的大腦處理語言和影像時所使用的可能是完全不同的機制,輸入等價但處理機制完全不同,可能最終的結果就是輸出也不同,
因而,將影像還原為語言或者將語言渲染為影像或許是一種行得通的方法,但卻不一定是一種完全的方法,有一些觀察影像時的感覺經驗,可能是無法通過主觀轉化變成語言標簽的,對于看圖做標簽的人來說,除了“貓”,“狗”這類可以語言化的感覺經驗外,還有相當一部分感覺經驗是難以言表的,既然這些經驗無法通過觀測者本身轉化為語言標簽,那么就無法構建資料集進行訓練,一種可能的解決方案是通過第三者觀測那個觀測影像的人的狀態,把其客觀表現作為標簽,
求點贊,求收藏,求分享
歡迎關注我的公眾號,微信搜索:知則
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/291385.html
標籤:其他
上一篇:視頻直播鑒權結合業務系統的token或session
下一篇:影像平滑(邊緣檢測)
