PHP- HTML parsing :: How can be taken charset value of webpage with simple html dom parser? -
PHP :: कैसे सरल (यूटीएफ -8, विंडोज़-255, आदि।) के साथ वेब पेज का अक्षरसेट मान लिया जा सकता है
टिप्पणी: इसे html dom पार्सर के साथ किया जाना है
उदाहरण 1 वेबपृष्ठ वर्णसेट इनपुट:
& lt; मेटा सामग्री = "पाठ / html; वर्णसेट = यूटीएफ -8" http-equiv = "सामग्री-प्रकार" & gt;
परिणाम: यूटीएफ -8
उदाहरण 2 वेबपृष्ठ वर्णसेट इनपुट:
& lt; मेटा सामग्री = "टेक्स्ट / html; charset = windows-255" http-equiv = "सामग्री-प्रकार" & gt;
परिणाम: खिड़कियां -255
संपादित करें:
मैं यह कोशिश करता हूँ (लेकिन इसका काम नहीं करता ):
$ html = file_get_html ('http://www.google.com/'); $ एल = $ html- & gt; लगता है ( 'मेटा [सामग्री]', 0); गूंज $ el- & gt; वर्णसेट;
क्या बदलाव होना चाहिए? (मुझे पता है कि $ एएल-> वर्णसेट काम नहीं कर रहा है)
धन्यवाद
आप 'स्ट्रिंग को नियमित अभिव्यक्ति का उपयोग करना होगा (मुझे आशा है कि आपके पास पीसीआर है ...)।
$ el = $ html- & gt; खोजें (' मेटा [http-equiv = content -टाइप] ', 0) $ fullvalue = $ el- & gt; सामग्री; Preg_match ('/ charset = (। +) /', $ पूर्णवल्यू, $ मैचों); प्रति मैच गूंज [1];
बहुत मजबूत नहीं है, लेकिन काम करना चाहिए।
Comments
Post a Comment