PHP- HTML parsing :: How can be taken charset value of webpage with simple html dom parser? -


PHP :: कैसे सरल (यूटीएफ -8, विंडोज़-255, आदि।) के साथ वेब पेज का अक्षरसेट मान लिया जा सकता है

टिप्पणी: इसे html dom पार्सर के साथ किया जाना है

उदाहरण 1 वेबपृष्ठ वर्णसेट इनपुट:

  & lt; मेटा सामग्री = "पाठ / html; वर्णसेट = यूटीएफ -8" http-equiv = "सामग्री-प्रकार" & gt;  

परिणाम: यूटीएफ -8



उदाहरण 2 वेबपृष्ठ वर्णसेट इनपुट:

  & lt; मेटा सामग्री = "टेक्स्ट / html; charset = windows-255" http-equiv = "सामग्री-प्रकार" & gt;  

परिणाम: खिड़कियां -255

संपादित करें:

मैं यह कोशिश करता हूँ (लेकिन इसका काम नहीं करता ):

  $ html = file_get_html ('http://www.google.com/'); $ एल = $ html- & gt; लगता है ( 'मेटा [सामग्री]', 0); गूंज $ el- & gt; वर्णसेट;  

क्या बदलाव होना चाहिए? (मुझे पता है कि $ एएल-> वर्णसेट काम नहीं कर रहा है)

धन्यवाद

आप 'स्ट्रिंग को नियमित अभिव्यक्ति का उपयोग करना होगा (मुझे आशा है कि आपके पास पीसीआर है ...)।

  $ el = $ html- & gt; खोजें (' मेटा [http-equiv = content -टाइप] ', 0) $ fullvalue = $ el- & gt; सामग्री; Preg_match ('/ charset = (। +) /', $ पूर्णवल्यू, $ मैचों); प्रति मैच गूंज [1];  

बहुत मजबूत नहीं है, लेकिन काम करना चाहिए।


Comments

Popular posts from this blog

c# - sqlDecimal to decimal clr stored procedure Unable to cast object of type 'System.Data.SqlTypes.SqlDecimal' to type 'System.IConvertible' -

Calling GetGUIThreadInfo from Outlook VBA -

Obfuscating Python code? -