mirror of
https://gitlab.com/news-flash/article_scraper.git
synced 2025-07-07 16:15:32 +02:00
add spiegel test
This commit is contained in:
parent
9aa6478e3c
commit
2c76a89f9d
3 changed files with 4045 additions and 1 deletions
52
article_scraper/resources/tests/ftr/spiegel-1/expected.html
Normal file
52
article_scraper/resources/tests/ftr/spiegel-1/expected.html
Normal file
|
@ -0,0 +1,52 @@
|
||||||
|
<article><section data-article-el="body">
|
||||||
|
<div data-area="top_element>image">
|
||||||
|
<figure>
|
||||||
|
<div data-sara-component="{"id":"51d712c3-9d59-4234-b369-6dc5de953038","name":"image","title":"\u003cp\u003e»Barbie« soll im Libanon nicht gezeigt werden\u003c/p\u003e","type":"media"}">
|
||||||
|
<picture>
|
||||||
|
<source srcset="https://cdn.prod.www.spiegel.de/images/51d712c3-9d59-4234-b369-6dc5de953038_w948_r2.1283783783783785_fpx55_fpy28.webp 948w, https://cdn.prod.www.spiegel.de/images/51d712c3-9d59-4234-b369-6dc5de953038_w520_r2.1283783783783785_fpx55_fpy28.webp 520w" sizes="(max-width: 519px) 100vw, (min-width: 520px) and (max-width: 719px) 520px, (min-width: 720px) and (max-width: 919px) 100vw, (min-width: 920px) and (max-width: 1011px) 920px, (min-width: 1012px) 948px" type="image/webp">
|
||||||
|
<img data-image-el="img" src="https://cdn.prod.www.spiegel.de/images/51d712c3-9d59-4234-b369-6dc5de953038_w948_r2.1283783783783785_fpx55_fpy28.jpg" width="948" height="445" title="»Barbie« soll im Libanon nicht gezeigt werden" alt="»Barbie« soll im Libanon nicht gezeigt werden" data-image-animation-origin="0df59b8e-c667-4bf5-b686-3266795cecf1"/>
|
||||||
|
</source></picture>
|
||||||
|
</div>
|
||||||
|
<figcaption>
|
||||||
|
<p>»Barbie« soll im Libanon nicht gezeigt werden</p>
|
||||||
|
<span>
|
||||||
|
Foto: <p>- / dpa</p>
|
||||||
|
</span>
|
||||||
|
</figcaption>
|
||||||
|
</figure>
|
||||||
|
</div>
|
||||||
|
<div data-area="body">
|
||||||
|
<div data-sara-click-el="body_element">
|
||||||
|
<p>Im <a href="https://www.spiegel.de/thema/libanon/" data-link-flag="spon" target="_blank">Libanon</a> soll der erfolgreiche <a href="https://www.spiegel.de/thema/hollywood/" data-link-flag="spon" target="_blank">Hollywood</a>-Streifen »Barbie« verboten werden, weil dieser der Regierung zufolge »Werbung für Homosexualität und Geschlechtsumwandlung« macht. Der Film verstoße gegen die »moralischen und religiösen Werte« des Landes, erklärte der libanesische Kulturminister Mohammed Mourtada. Ursprünglich sollte der Blockbuster, der weltweit <a href="https://www.spiegel.de/kultur/kino/barbie-hat-eine-milliarde-us-dollar-weltweit-eingespielt-a-61b0c5f7-e354-4ce9-a021-8c3305a29ff7" data-link-flag="spon" target="_blank">bereits mehr als eine Milliarde Dollar </a>(rund 910 Millionen Euro) eingespielt hat, ab dem 31. August im Libanon gezeigt werden.</p>
|
||||||
|
</div>
|
||||||
|
|
||||||
|
<div data-sara-click-el="body_element">
|
||||||
|
<p>Mourtada erklärte weiter, »Barbie« unterstütze die »Ablehnung der Vormundschaft des Vaters«, ziehe die Rolle der Mutter ins Lächerliche und stelle die Ehe und die Gründung einer Familie infrage.</p>
|
||||||
|
</div>
|
||||||
|
<div data-sara-click-el="body_element">
|
||||||
|
|
||||||
|
|
||||||
|
<div data-settings="{"consentType":"thirdparty"}">
|
||||||
|
|
||||||
|
An dieser Stelle finden Sie einen externen Inhalt von Twitter,
|
||||||
|
der den Artikel ergänzt und von der Redaktion empfohlen wird. Sie können ihn sich mit einem Klick anzeigen lassen
|
||||||
|
und wieder ausblenden.
|
||||||
|
</div>
|
||||||
|
|
||||||
|
<div data-sara-click-el="body_element">
|
||||||
|
<p>In dem Film von US-Regisseurin Greta Gerwig verlassen <a href="https://www.spiegel.de/thema/barbie/" data-link-flag="spon" target="_blank">Barbie</a> und Ken, gespielt von den Superstars <a href="https://www.spiegel.de/thema/margot-robbie/" data-link-flag="spon" target="_blank">Margot Robbie</a> und <a href="https://www.spiegel.de/thema/ryan_gosling/" data-link-flag="spon" target="_blank">Ryan Gosling</a>, die pinkfarbene Plastikwelt Barbieland und lernen in <a href="https://www.spiegel.de/thema/los_angeles/" data-link-flag="spon" target="_blank">Los Angeles</a> das echte Leben kennen.</p>
|
||||||
|
</div>
|
||||||
|
|
||||||
|
<div data-sara-click-el="body_element">
|
||||||
|
<h3>Community unter Druck</h3><p>Der Libanon gilt in Bezug auf Homosexualität als toleranter als andere arabische Staaten. Allerdings haben religiöse Organisationen wie die radikalislamische <a href="https://www.spiegel.de/thema/hisbollah/" data-link-flag="spon" target="_blank">Hisbollah</a> einen großen Einfluss auf soziale und kulturelle Einrichtungen.</p><p>Immer wieder wurden in den vergangenen Jahren Veranstaltungen der <a href="https://www.spiegel.de/kultur/musik/mashrou-leila-regenbogen-auf-halbmast-a-1e6bdb86-e0e4-4ffa-8f35-5aac4cb5d1e1" data-link-flag="spon" target="_blank">libanesischen LGBTQ+-Community </a>abgesagt. Zudem steht Homosexualität im Libanon nach wie vor unter Strafe.</p>
|
||||||
|
</div>
|
||||||
|
|
||||||
|
|
||||||
|
<div data-sara-click-el="body_element">
|
||||||
|
<p>Die englische Abkürzung LGBTQ+ steht für lesbisch, schwul, bisexuell, transgender, queer und andere Geschlechtsidentitäten.</p>
|
||||||
|
|
||||||
|
</div>
|
||||||
|
</div>
|
||||||
|
|
||||||
|
</div>
|
||||||
|
</section></article>
|
3988
article_scraper/resources/tests/ftr/spiegel-1/source.html
Normal file
3988
article_scraper/resources/tests/ftr/spiegel-1/source.html
Normal file
File diff suppressed because one or more lines are too long
|
@ -74,11 +74,15 @@ async fn hardwareluxx() {
|
||||||
}
|
}
|
||||||
|
|
||||||
#[tokio::test]
|
#[tokio::test]
|
||||||
#[ignore = "waiting on clarification for https://github.com/fivefilters/ftr-site-config/pull/1081"]
|
|
||||||
async fn heise_1() {
|
async fn heise_1() {
|
||||||
run_test("heise-1", "https://www.heise.de/", None, None).await
|
run_test("heise-1", "https://www.heise.de/", None, None).await
|
||||||
}
|
}
|
||||||
|
|
||||||
|
#[tokio::test]
|
||||||
|
async fn spiegel_1() {
|
||||||
|
run_test("spiegel-1", "https://www.spiegel.de/", None, None).await
|
||||||
|
}
|
||||||
|
|
||||||
#[tokio::test]
|
#[tokio::test]
|
||||||
#[ignore = "downloads content from the web"]
|
#[ignore = "downloads content from the web"]
|
||||||
async fn encoding_windows_1252() {
|
async fn encoding_windows_1252() {
|
||||||
|
|
Loading…
Add table
Add a link
Reference in a new issue