[tvn24] refactor nextjs frontend handling

mitigating HTTP 404 response issues
2021-04-09 01:50:18 +02:00 · 2021-04-09 01:50:18 +02:00 · baf8549c0a
parent dae5140251
commit baf8549c0a
2 changed files with 61 additions and 40 deletions
--- a/haruhi_dl/extractor/extractors.py
+++ b/haruhi_dl/extractor/extractors.py
@ -1377,7 +1377,10 @@ from .tvc import (
 from .tver import TVerIE
 from .tvigle import TvigleIE
 from .tvland import TVLandIE
-from .tvn24 import TVN24IE
+from .tvn24 import (
    TVN24IE,
    TVN24NuviIE,
 )
 from .tvnet import TVNetIE
 from .tvnoe import TVNoeIE
 from .tvnow import (
--- a/haruhi_dl/extractor/tvn24.py
+++ b/haruhi_dl/extractor/tvn24.py
@ -2,6 +2,10 @@
 from __future__ import unicode_literals
 import re
 from urllib.parse import (
    parse_qs,
    urlparse,
 )
 from .common import InfoExtractor
 from ..utils import (
@ -14,7 +18,45 @@ from ..utils import (
 )
-class TVN24IE(InfoExtractor):
+class TVNBaseIE(InfoExtractor):
    def _parse_nuvi_data(self, data, display_id):
        video = data['movie']['video']
        info = data['movie']['info']
        if video.get('protections'):
            raise ExtractorError(
                'This video is protected by %s DRM protection' % '/'.join(video['protections'].keys()),
                expected=True)
        formats = []
        for fmt_id, fmt_data in video['sources'].items():
            if fmt_id == 'hls':
                formats.extend(self._extract_m3u8_formats(fmt_data['url'], display_id, ext='mp4'))
            elif fmt_id == 'dash':
                formats.extend(self._extract_mpd_formats(fmt_data['url'], display_id))
            elif fmt_id == 'mp4':
                for quality, mp4_url in fmt_data.items():
                    formats.append({
                        'url': mp4_url,
                        'ext': 'mp4',
                        'height': int_or_none(quality),
                    })
        self._sort_formats(formats)
        return {
            'id': display_id,
            'formats': formats,
            'title': unescapeHTML(info.get('episode_title')),
            'description': unescapeHTML(info.get('description')),
            'duration': int_or_none(info.get('total_time')),
            'age_limit': int_or_none(data['movie']['options'].get('parental_rating', {}).get('rating')),
            'is_live': video.get('is_live'),
        }
 class TVN24IE(TVNBaseIE):
    _VALID_URL = r'https?://(?:www\.)?(?P<domain>(?:(?:[^/]+)\.)?tvn24\.pl)/(?:[^/]+/)*[^/?#\s]+[,-](?P<id>\d+)(?:\.html)?'
    _TESTS = [{
        'url': 'https://tvn24.pl/polska/edyta-gorniak-napisala-o-statystach-w-szpitalach-udajacych-chorych-na-covid-19-jerzy-polaczek-i-marek-posobkiewicz-odpowiadaja-zapraszamy-4747899',
@ -183,14 +225,13 @@ class TVN24IE(InfoExtractor):
            plst_url = re.sub(r'[?#].+', '', url)
            plst_url += '/nuviArticle?playlist&id=%s&r=%s' % (video['id'], route_name)
-            plst = self._download_json(plst_url, display_id)
+            entries.append({
-
+                '_type': 'url_transparent',
-            data = self._parse_nuvi_data(plst, display_id)
+                'url': plst_url,
-            data.update({
+                'ie_key': 'TVN24Nuvi',
                'title': fields['title'],
                'description': fields['description'],
            })
            entries.append(data)
        return {
            '_type': 'playlist',
@ -210,38 +251,15 @@ class TVN24IE(InfoExtractor):
        return self._parse_nuvi_data(data, display_id)
    def _parse_nuvi_data(self, data, display_id):
        video = data['movie']['video']
        info = data['movie']['info']
-        if video.get('protections'):
+class TVN24NuviIE(TVNBaseIE):
-            raise ExtractorError(
+    # handles getting specific videos from the list of nuvi urls
-                'This video is protected by %s DRM protection' % '/'.join(video['protections'].keys()),
+    _VALID_URL = r'https?://(?:www\.)?(?P<domain>(?:(?:[^/]+)\.)?tvn24\.pl)/(?:[^/]+/)*[^/?#\s]+[,-](?P<id>\d+)(?:\.html)?/nuviArticle'
-                expected=True)
+    IE_NAME = 'tvn24:nuvi'
    IE_DESC = False  # do not list
-        formats = []
+    def _real_extract(self, url):
-
+        qs = parse_qs(urlparse(url).query)
-        for fmt_id, fmt_data in video['sources'].items():
+        video_id = qs['id'][0]
-            if fmt_id == 'hls':
+        plst = self._download_json(url, video_id)
-                formats.extend(self._extract_m3u8_formats(fmt_data['url'], display_id))
+        return self._parse_nuvi_data(plst, video_id)
            elif fmt_id == 'dash':
                formats.extend(self._extract_mpd_formats(fmt_data['url'], display_id))
            elif fmt_id == 'mp4':
                for quality, mp4_url in fmt_data.items():
                    formats.append({
                        'url': mp4_url,
                        'ext': 'mp4',
                        'height': int_or_none(quality),
                    })
        self._sort_formats(formats)
        return {
            'id': display_id,
            'formats': formats,
            'title': unescapeHTML(info.get('episode_title')),
            'description': unescapeHTML(info.get('description')),
            'duration': int_or_none(info.get('total_time')),
            'age_limit': int_or_none(data['movie']['options'].get('parental_rating', {}).get('rating')),
            'is_live': video.get('is_live'),
        }