PHP- HTML parsing :: How can be taken charset value of webpage with simple html dom parser? -

- February 15, 2015

PHP :: कैसे सरल (यूटीएफ -8, विंडोज़-255, आदि।) के साथ वेब पेज का अक्षरसेट मान लिया जा सकता है

टिप्पणी: इसे html dom पार्सर के साथ किया जाना है

उदाहरण 1 वेबपृष्ठ वर्णसेट इनपुट:

  & lt; मेटा सामग्री = "पाठ / html; वर्णसेट = यूटीएफ -8" http-equiv = "सामग्री-प्रकार" & gt;

परिणाम: यूटीएफ -8

उदाहरण 2 वेबपृष्ठ वर्णसेट इनपुट:

  & lt; मेटा सामग्री = "टेक्स्ट / html; charset = windows-255" http-equiv = "सामग्री-प्रकार" & gt;

परिणाम: खिड़कियां -255

संपादित करें:

मैं यह कोशिश करता हूँ (लेकिन इसका काम नहीं करता ):

  $ html = file_get_html ('http://www.google.com/'); $ एल = $ html- & gt; लगता है ( 'मेटा [सामग्री]', 0); गूंज $ el- & gt; वर्णसेट;

क्या बदलाव होना चाहिए? (मुझे पता है कि $ एएल-> वर्णसेट काम नहीं कर रहा है)

धन्यवाद

आप 'स्ट्रिंग को नियमित अभिव्यक्ति का उपयोग करना होगा (मुझे आशा है कि आपके पास पीसीआर है ...)।

  $ el = $ html- & gt; खोजें (' मेटा [http-equiv = content -टाइप] ', 0) $ fullvalue = $ el- & gt; सामग्री; Preg_match ('/ charset = (। +) /', $ पूर्णवल्यू, $ मैचों); प्रति मैच गूंज [1];

बहुत मजबूत नहीं है, लेकिन काम करना चाहिए।

Search This Blog

Add s econ

PHP- HTML parsing :: How can be taken charset value of webpage with simple html dom parser? -

संपादित करें:

Comments

Post a Comment

Popular posts from this blog

wpf - Line breaks and indenting for the XAML of a saved FlowDocument? -

session - security issue: php login/logout script + back button -

Eclipse and GWT -