aboutsummaryrefslogtreecommitdiffstats
path: root/tests/misc
diff options
context:
space:
mode:
authorYuri Takhteyev <yuri@freewisdom.org>2007-03-25 03:58:40 +0000
committerYuri Takhteyev <yuri@freewisdom.org>2007-03-25 03:58:40 +0000
commit0a1c1b5aeb62afa21bd676cfba6cf88821f1176f (patch)
treefed847ee9c4fe0f748f69eb70284dbeb9f3f30f5 /tests/misc
parentdfe98ef458d5e05b13962307468904da8d09574c (diff)
downloadmarkdown-0a1c1b5aeb62afa21bd676cfba6cf88821f1176f.tar.gz
markdown-0a1c1b5aeb62afa21bd676cfba6cf88821f1176f.tar.bz2
markdown-0a1c1b5aeb62afa21bd676cfba6cf88821f1176f.zip
Added test cases
Diffstat (limited to 'tests/misc')
-rw-r--r--tests/misc/adjacent-headers.html7
-rw-r--r--tests/misc/adjacent-headers.txt2
-rw-r--r--tests/misc/amp-in-url.html5
-rw-r--r--tests/misc/amp-in-url.txt1
-rw-r--r--tests/misc/ampersand.html7
-rw-r--r--tests/misc/ampersand.txt5
-rw-r--r--tests/misc/arabic.html39
-rw-r--r--tests/misc/arabic.txt37
-rw-r--r--tests/misc/attributes2.html14
-rw-r--r--tests/misc/attributes2.txt10
-rw-r--r--tests/misc/benchmark.dat46
-rw-r--r--tests/misc/benchmark.dat.tmp47
-rw-r--r--tests/misc/bidi.html63
-rw-r--r--tests/misc/bidi.txt68
-rw-r--r--tests/misc/blank-block-quote.html7
-rw-r--r--tests/misc/blank-block-quote.txt6
-rw-r--r--tests/misc/br.html16
-rw-r--r--tests/misc/br.txt16
-rw-r--r--tests/misc/comments.html11
-rw-r--r--tests/misc/comments.txt7
-rw-r--r--tests/misc/div.html9
-rw-r--r--tests/misc/div.txt5
-rw-r--r--tests/misc/email.html6
-rw-r--r--tests/misc/email.txt3
-rw-r--r--tests/misc/funky-list.html31
-rw-r--r--tests/misc/funky-list.txt9
-rw-r--r--tests/misc/h1.html9
-rw-r--r--tests/misc/h1.txt7
-rw-r--r--tests/misc/hash.html18
-rw-r--r--tests/misc/hash.txt13
-rw-r--r--tests/misc/headers.html14
-rw-r--r--tests/misc/headers.txt9
-rw-r--r--tests/misc/hline.html7
-rw-r--r--tests/misc/hline.txt5
-rw-r--r--tests/misc/html.html13
-rw-r--r--tests/misc/html.txt10
-rw-r--r--tests/misc/image-2.html7
-rw-r--r--tests/misc/image-2.txt3
-rw-r--r--tests/misc/image.html5
-rw-r--r--tests/misc/image.txt2
-rw-r--r--tests/misc/image_in_links.html5
-rw-r--r--tests/misc/image_in_links.txt3
-rw-r--r--tests/misc/inside_html.html5
-rw-r--r--tests/misc/inside_html.txt1
-rw-r--r--tests/misc/japanese.html28
-rw-r--r--tests/misc/japanese.txt15
-rw-r--r--tests/misc/lists.html64
-rw-r--r--tests/misc/lists.txt31
-rw-r--r--tests/misc/lists2.html10
-rw-r--r--tests/misc/lists2.txt3
-rw-r--r--tests/misc/lists3.html10
-rw-r--r--tests/misc/lists3.txt3
-rw-r--r--tests/misc/lists4.html21
-rw-r--r--tests/misc/lists4.txt5
-rw-r--r--tests/misc/lists5.html21
-rw-r--r--tests/misc/lists5.txt12
-rw-r--r--tests/misc/markup-inside-p.html25
-rw-r--r--tests/misc/markup-inside-p.txt21
-rw-r--r--tests/misc/more_comments.html3
-rw-r--r--tests/misc/more_comments.txt9
-rw-r--r--tests/misc/multi-line-tags.html9
-rw-r--r--tests/misc/multi-line-tags.txt6
-rw-r--r--tests/misc/multi-test.html37
-rw-r--r--tests/misc/multi-test.txt32
-rw-r--r--tests/misc/multiline-comments.html21
-rw-r--r--tests/misc/multiline-comments.txt18
-rw-r--r--tests/misc/normalize.html5
-rw-r--r--tests/misc/normalize.txt2
-rw-r--r--tests/misc/numeric-entity.html7
-rw-r--r--tests/misc/numeric-entity.txt4
-rw-r--r--tests/misc/php.html16
-rw-r--r--tests/misc/php.txt13
-rw-r--r--tests/misc/pre.html17
-rw-r--r--tests/misc/pre.txt14
-rw-r--r--tests/misc/russian.html15
-rw-r--r--tests/misc/russian.txt15
-rw-r--r--tests/misc/some-test.html105
-rw-r--r--tests/misc/some-test.txt57
-rw-r--r--tests/misc/span.html11
-rw-r--r--tests/misc/span.txt10
-rw-r--r--tests/misc/stronintags.html10
-rw-r--r--tests/misc/stronintags.txt8
-rw-r--r--tests/misc/tabs-in-lists.html67
-rw-r--r--tests/misc/tabs-in-lists.txt32
-rw-r--r--tests/misc/two-spaces.html9
-rw-r--r--tests/misc/two-spaces.txt6
-rw-r--r--tests/misc/uche.html10
-rw-r--r--tests/misc/uche.txt7
-rw-r--r--tests/misc/underscores.html15
-rw-r--r--tests/misc/underscores.txt11
-rw-r--r--tests/misc/url_spaces.html7
-rw-r--r--tests/misc/url_spaces.txt4
-rw-r--r--tests/misc/utfbom.html7
-rw-r--r--tests/misc/utfbom.txt4
94 files changed, 1505 insertions, 0 deletions
diff --git a/tests/misc/adjacent-headers.html b/tests/misc/adjacent-headers.html
new file mode 100644
index 0000000..43ad50c
--- /dev/null
+++ b/tests/misc/adjacent-headers.html
@@ -0,0 +1,7 @@
+
+
+<h1>this is a huge header</h1>
+
+<h2>this is a smaller header</h2>
+
+
diff --git a/tests/misc/adjacent-headers.txt b/tests/misc/adjacent-headers.txt
new file mode 100644
index 0000000..0e626b9
--- /dev/null
+++ b/tests/misc/adjacent-headers.txt
@@ -0,0 +1,2 @@
+# this is a huge header #
+## this is a smaller header ##
diff --git a/tests/misc/amp-in-url.html b/tests/misc/amp-in-url.html
new file mode 100644
index 0000000..f4c1ac5
--- /dev/null
+++ b/tests/misc/amp-in-url.html
@@ -0,0 +1,5 @@
+
+<p><a href="http://www.freewisdom.org/this&amp;that">link</a>
+</p>
+
+
diff --git a/tests/misc/amp-in-url.txt b/tests/misc/amp-in-url.txt
new file mode 100644
index 0000000..471106e
--- /dev/null
+++ b/tests/misc/amp-in-url.txt
@@ -0,0 +1 @@
+[link](http://www.freewisdom.org/this&that)
diff --git a/tests/misc/ampersand.html b/tests/misc/ampersand.html
new file mode 100644
index 0000000..672ffa5
--- /dev/null
+++ b/tests/misc/ampersand.html
@@ -0,0 +1,7 @@
+
+<p>&amp;
+</p>
+<p>AT&amp;T
+</p>
+
+
diff --git a/tests/misc/ampersand.txt b/tests/misc/ampersand.txt
new file mode 100644
index 0000000..367d32c
--- /dev/null
+++ b/tests/misc/ampersand.txt
@@ -0,0 +1,5 @@
+&
+
+AT&T
+
+
diff --git a/tests/misc/arabic.html b/tests/misc/arabic.html
new file mode 100644
index 0000000..476500f
--- /dev/null
+++ b/tests/misc/arabic.html
@@ -0,0 +1,39 @@
+
+
+<h1 dir="rtl">بايثون</h1>
+<p dir="rtl"><strong>بايثون</strong> لغة برمجة حديثة بسيطة، واضحة، سريعة ، تستخدم أسلوب البرمجة الكائنية (OOP) وقابلة للتطوير بالإضافة إلى أنها مجانية و مفتوحة المصدر. صُنفت بالأساس كلغة تفسيرية ، بايثون مصممة أصلاً للأداء بعض المهام الخاصة أو المحدودة. إلا أنه يمكن استخدامها بايثون لإنجاز المشاريع الضخمه كأي لغة برمجية أخرى، غالباً ما يُنصح المبتدئين في ميدان البرمجة بتعلم هذه اللغة لأنها من بين أسهل اللغات البرمجية تعلماً.
+</p>
+<p dir="rtl">نشأت بايثون في مركز CWI (مركز العلوم والحاسب الآلي) بأمستردام على يد جويدو فان رُزوم. تم تطويرها بلغة C. أطلق فان رُزوم اسم &quot;بايثون&quot; على لغته تعبيرًا عن إعجابه بفِرقَة مسرحية هزلية شهيرة من بريطانيا، كانت تطلق على نفسها اسم مونتي بايثون Monty Python.
+</p>
+<p dir="rtl">تتميز بايثون بمجتمعها النشط ، كما أن لها الكثير من المكتبات البرمجية ذات الأغراض الخاصة والتي برمجها أشخاص من مجتمع هذه اللغة ، مثلاً مكتبة PyGame التي توفر مجموعه من الوظائف من اجل برمجة الالعاب. ويمكن لبايثون التعامل مع العديد من أنواع قواعد البيانات مثل MySQL وغيره.
+</p>
+
+<h2 dir="rtl">أمثلة</h2>
+<p dir="rtl">مثال Hello World!
+</p>
+<pre><code>print &quot;Hello World!&quot;
+</code></pre><p dir="rtl">مثال لاستخراج المضروب Factorial :
+</p>
+<pre><code>num = 1
+x = raw_input('Insert the number please ')
+x = int(x)
+
+if x &gt; 69:
+ print 'Math Error !'
+else:
+ while x &gt; 1:
+ num *= x
+ x = x-1
+
+ print num
+</code></pre>
+<h2 dir="rtl">وصلات خارجية</h2>
+<ul dir="rtl">
+ <li dir="rtl">
+ <a href="http://www.python.org">الموقع الرسمي للغة بايثون</a>
+ </li>
+</ul>
+<p dir="rtl"> بذرة حاس
+</p>
+
+
diff --git a/tests/misc/arabic.txt b/tests/misc/arabic.txt
new file mode 100644
index 0000000..ba2fef4
--- /dev/null
+++ b/tests/misc/arabic.txt
@@ -0,0 +1,37 @@
+
+بايثون
+=====
+
+**بايثون** لغة برمجة حديثة بسيطة، واضحة، سريعة ، تستخدم أسلوب البرمجة الكائنية (OOP) وقابلة للتطوير بالإضافة إلى أنها مجانية و مفتوحة المصدر. صُنفت بالأساس كلغة تفسيرية ، بايثون مصممة أصلاً للأداء بعض المهام الخاصة أو المحدودة. إلا أنه يمكن استخدامها بايثون لإنجاز المشاريع الضخمه كأي لغة برمجية أخرى، غالباً ما يُنصح المبتدئين في ميدان البرمجة بتعلم هذه اللغة لأنها من بين أسهل اللغات البرمجية تعلماً.
+
+نشأت بايثون في مركز CWI (مركز العلوم والحاسب الآلي) بأمستردام على يد جويدو فان رُزوم. تم تطويرها بلغة C. أطلق فان رُزوم اسم "بايثون" على لغته تعبيرًا عن إعجابه بفِرقَة مسرحية هزلية شهيرة من بريطانيا، كانت تطلق على نفسها اسم مونتي بايثون Monty Python.
+
+تتميز بايثون بمجتمعها النشط ، كما أن لها الكثير من المكتبات البرمجية ذات الأغراض الخاصة والتي برمجها أشخاص من مجتمع هذه اللغة ، مثلاً مكتبة PyGame التي توفر مجموعه من الوظائف من اجل برمجة الالعاب. ويمكن لبايثون التعامل مع العديد من أنواع قواعد البيانات مثل MySQL وغيره.
+
+##أمثلة
+مثال Hello World!
+
+ print "Hello World!"
+
+
+مثال لاستخراج المضروب Factorial :
+
+ num = 1
+ x = raw_input('Insert the number please ')
+ x = int(x)
+
+ if x > 69:
+ print 'Math Error !'
+ else:
+ while x > 1:
+ num *= x
+ x = x-1
+
+ print num
+
+
+
+##وصلات خارجية
+* [الموقع الرسمي للغة بايثون](http://www.python.org)
+
+ بذرة حاس
diff --git a/tests/misc/attributes2.html b/tests/misc/attributes2.html
new file mode 100644
index 0000000..62cbaca
--- /dev/null
+++ b/tests/misc/attributes2.html
@@ -0,0 +1,14 @@
+
+<p id="TABLE.OF.CONTENTS">
+</p>
+<ul>
+ <li id="TABLEOFCONTENTS">
+
+ </li>
+</ul>
+<p id="TABLEOFCONTENTS">Or in the middle of the text
+</p>
+<p id="tableofcontents">
+</p>
+
+
diff --git a/tests/misc/attributes2.txt b/tests/misc/attributes2.txt
new file mode 100644
index 0000000..d635cb2
--- /dev/null
+++ b/tests/misc/attributes2.txt
@@ -0,0 +1,10 @@
+{@id=TABLE.OF.CONTENTS}
+
+
+* {@id=TABLEOFCONTENTS}
+
+
+Or in the middle of the text {@id=TABLEOFCONTENTS}
+
+{@id=tableofcontents}
+
diff --git a/tests/misc/benchmark.dat b/tests/misc/benchmark.dat
new file mode 100644
index 0000000..aeaff6f
--- /dev/null
+++ b/tests/misc/benchmark.dat
@@ -0,0 +1,46 @@
+construction:0.000000:0.000000
+adjacent-headers:0.010000:0.000000
+amp-in-url:0.020000:0.000000
+ampersand:0.010000:0.000000
+arabic:0.170000:126976.000000
+attributes2:0.030000:0.000000
+bidi:0.450000:110592.000000
+blank-block-quote:0.020000:0.000000
+br:0.050000:0.000000
+comments:0.040000:0.000000
+div:0.040000:0.000000
+email:0.040000:0.000000
+funky-list:0.080000:0.000000
+h1:0.030000:0.000000
+hash:0.050000:0.000000
+headers:0.070000:0.000000
+hline:0.040000:0.000000
+html:0.080000:0.000000
+image:0.030000:0.000000
+image-2:0.040000:0.000000
+image_in_links:0.030000:0.000000
+inside_html:0.030000:0.000000
+japanese:0.110000:0.000000
+lists:0.080000:0.000000
+lists2:0.030000:0.000000
+lists3:0.030000:0.000000
+lists4:0.030000:0.000000
+lists5:0.040000:0.000000
+markup-inside-p:0.060000:0.000000
+more_comments:0.030000:0.000000
+multi-line-tags:0.040000:0.000000
+multi-test:0.100000:-12288.000000
+multiline-comments:0.060000:0.000000
+normalize:0.040000:0.000000
+numeric-entity:0.060000:0.000000
+php:0.070000:0.000000
+pre:0.050000:0.000000
+russian:0.220000:0.000000
+some-test:0.210000:0.000000
+span:0.110000:0.000000
+stronintags:0.100000:0.000000
+tabs-in-lists:0.140000:0.000000
+two-spaces:0.070000:0.000000
+uche:0.080000:0.000000
+underscores:0.100000:0.000000
+url_spaces:0.080000:0.000000
diff --git a/tests/misc/benchmark.dat.tmp b/tests/misc/benchmark.dat.tmp
new file mode 100644
index 0000000..b18e8d1
--- /dev/null
+++ b/tests/misc/benchmark.dat.tmp
@@ -0,0 +1,47 @@
+construction:0.000000:0.000000
+adjacent-headers:0.030000:0.000000
+amp-in-url:0.020000:0.000000
+ampersand:0.020000:0.000000
+arabic:0.170000:135168.000000
+attributes2:0.040000:0.000000
+bidi:0.460000:217088.000000
+blank-block-quote:0.010000:0.000000
+br:0.050000:0.000000
+comments:0.030000:0.000000
+div:0.050000:0.000000
+email:0.050000:0.000000
+funky-list:0.080000:0.000000
+h1:0.030000:0.000000
+hash:0.050000:0.000000
+headers:0.060000:0.000000
+hline:0.010000:0.000000
+html:0.070000:0.000000
+image:0.030000:0.000000
+image-2:0.050000:0.000000
+image_in_links:0.030000:0.000000
+inside_html:0.030000:0.000000
+japanese:0.120000:0.000000
+lists:0.090000:0.000000
+lists2:0.030000:0.000000
+lists3:0.030000:0.000000
+lists4:0.030000:0.000000
+lists5:0.050000:0.000000
+markup-inside-p:0.060000:0.000000
+more_comments:0.030000:0.000000
+multi-line-tags:0.040000:0.000000
+multi-test:0.110000:0.000000
+multiline-comments:0.060000:0.000000
+normalize:0.040000:0.000000
+numeric-entity:0.050000:0.000000
+php:0.060000:0.000000
+pre:0.050000:0.000000
+russian:0.180000:-49152.000000
+some-test:0.180000:-28672.000000
+span:0.100000:0.000000
+stronintags:0.090000:0.000000
+tabs-in-lists:0.140000:0.000000
+two-spaces:0.070000:0.000000
+uche:0.090000:0.000000
+underscores:0.100000:0.000000
+url_spaces:0.080000:0.000000
+utfbom:0.050000:0.000000
diff --git a/tests/misc/bidi.html b/tests/misc/bidi.html
new file mode 100644
index 0000000..a1a6068
--- /dev/null
+++ b/tests/misc/bidi.html
@@ -0,0 +1,63 @@
+
+<p><strong>Python</strong>(パイソン)は、<a href="http://en.wikipedia.org/wiki/Guido_van_Rossum">Guido van Rossum</a> によって作られたオープンソースのオブジェクト指向スクリプト言語。<a href="http://ja.wikipedia.org/wiki/Perl">Perl</a>とともに欧米で広く普及している。イギリスのテレビ局 BBC が製作したコメディ番組『空飛ぶモンティ・パイソン』にちなんで名付けられた。 (Pythonには、爬虫類のニシキヘビの意味があり、Python言語のマスコットやアイコンとして使われることがある。)
+</p>
+<p>|||||||||||||||||||||||||||||THIS SHOULD BE LTR|||||||||||||||||||||||||
+</p>
+<p dir="rtl">|||||||||||||||||||||||||||||THIS SHOULD BE RTL|||||||||||||||||||||||||
+</p>
+<p dir="ltr">(<strong>بايثون</strong> لغة برمجة حديثة بسيطة، واضحة، سريعة ، تستخدم أسلوب البرمجة الكائنية (THIS SHOULD BE LTR ) وقابلة للتطوير بالإضافة إلى أنها مجانية و مفتوح
+</p>
+<p dir="rtl">پایتون زبان برنامه‌نویسی تفسیری و سطح بالا ، شی‌گرا و یک زبان برنامه‌نویسی تفسیری سمت سرور قدرتمند است که توسط گیدو ون روسوم در سال ۱۹۹۰ ساخته شد. این زبان در ویژگی‌ها شبیه پرل، روبی، اسکیم، اسمال‌تاک و تی‌سی‌ال است و از مدیریت خودکار حافظه استفاده می‌کند
+</p>
+<p>Python,是一种面向对象的、直譯式的计算机程序设计语言,也是一种功能强大而完善的通用型语言,已经具有十多年的发展历史,成熟且稳定。
+</p>
+<p dir="rtl">ބްލޫ ވޭލްގެ ދޫ މަތީގައި އެއްފަހަރާ 50 މީހުންނަށް ތިބެވިދާނެވެ. ބޮޑު މަހުގެ ދުލަކީ އެހާމެ ބޮޑު އެއްޗެކެވެ.
+</p>
+<p><strong>உருது</strong> 13ஆம் நூற்றாண்டில் உருவான ஒரு இந்தோ-ஐரோப்பிய மொழியாகும். உருது, ஹிந்தியுடன் சேர்த்து &quot;ஹிந்துஸ்தானி&quot; என அழைக்கப்படுகின்றது. மண்டரின், ஆங்கிலம் ஆகியவற்றுக்கு அடுத்தபடியாக மூன்றாவது கூடிய அளவு மக்களால் புரிந்து கொள்ளப்படக்கூடியது ஹிந்துஸ்தானியேயாகும். தாய் மொழியாகப் பேசுபவர்கள் எண்ணிக்கையின் அடிப்படையில் உருது உலகின் 20 ஆவது பெரிய மொழியாகும். 6 கோடி மக்கள் இதனைத் தாய் மொழியாகக் கொண்டுள்ளார்கள். இரண்டாவது மொழியாகக் கொண்டுள்ளவர்கள் உட்பட 11 கோடிப் பேர் இதனைப் பேசுகிறார்கள். உருது பாகிஸ்தானின் அரசகரும மொழியாகவும், இந்தியாவின் அரசகரும மொழிகளுள் ஒன்றாகவும் விளங்குகிறது.
+</p>
+<p dir="rtl">اردو ہندوآریائی زبانوں کی ہندويورپی شاخ کی ایک زبان ہے جو تيرھويں صدی ميں بر صغير ميں پيدا ہوئی ـ اردو پاکستان کی سرکاری زبان ہے اور بھارت کی سرکاری زبانوں ميں سے ايک ہے۔ اردو بھارت ميں 5 کروڑ اور پاکستان ميں 1 کروڑ لوگوں کی مادری زبان ہے مگر اسے بھارت اور پاکستان کے تقریباً 50 کروڑ لوگ بول اور سمجھ سکتے ھیں ۔ جن میں سے تقریباً 10.5 کروڑ لوگ اسے باقاعدہ بولتے ھیں۔
+</p>
+
+<h1 dir="rtl">بايثون</h1>
+<p dir="rtl"><strong>بايثون</strong> لغة برمجة حديثة بسيطة، واضحة، سريعة ، تستخدم أسلوب البرمجة الكائنية (OOP) وقابلة للتطوير بالإضافة إلى أنها مجانية و مفتوحة المصدر. صُنفت بالأساس كلغة تفسيرية ، بايثون مصممة أصلاً للأداء بعض المهام الخاصة أو المحدودة. إلا أنه يمكن استخدامها بايثون لإنجاز المشاريع الضخمه كأي لغة برمجية أخرى، غالباً ما يُنصح المبتدئين في ميدان البرمجة بتعلم هذه اللغة لأنها من بين أسهل اللغات البرمجية تعلماً.
+</p>
+<p dir="rtl">|||||||||||||||||||||||||||||THIS SHOULD BE RTL|||||||||||||||||||||||||
+</p>
+<p dir="rtl">(نشأت بايثون في مركز CWI (مركز العلوم والحاسب الآلي) بأمستردام على يد جويدو فان رُزوم. تم تطويرها بلغة C. أطلق فان رُزوم اسم &quot;بايثون&quot; على لغته تعبيرًا عن إعجابه بفِرقَة مسرحية هزلية شهيرة من بريطانيا، كانت تطلق على نفسها اسم مونتي بايثون Monty Python.
+</p>
+<p dir="rtl">تتميز بايثون بمجتمعها النشط ، كما أن لها الكثير من المكتبات البرمجية ذات الأغراض الخاصة والتي برمجها أشخاص من مجتمع هذه اللغة ، مثلاً مكتبة PyGame التي توفر مجموعه من الوظائف من اجل برمجة الالعاب. ويمكن لبايثون التعامل مع العديد من أنواع قواعد البيانات مثل MySQL وغيره.
+</p>
+
+<h2 dir="rtl">أمثلة</h2>
+<p dir="rtl">مثال Hello World!
+</p>
+<pre><code>print &quot;Hello World!&quot;
+</code></pre><p dir="rtl">مثال لاستخراج المضروب Factorial :
+</p>
+<pre><code>num = 1
+x = raw_input('Insert the number please ')
+x = int(x)
+
+if x &gt; 69:
+ print 'Math Error !'
+else:
+ while x &gt; 1:
+ num *= x
+ x = x-1
+
+ print num
+</code></pre>
+<h2 dir="rtl">وصلات خارجية</h2>
+<ul dir="rtl">
+ <li dir="rtl">
+ <a href="http://www.python.org">الموقع الرسمي للغة بايثون</a>
+ </li>
+</ul>
+<p dir="rtl"> بذرة حاس
+</p>
+<p><strong>Недвард «Нед» Фландерс</strong> (Nedward «Ned» Flanders) — вымышленный персонаж мультсериала «[Симпсоны][]», озвученный Гарри Ширером. Он и его семья живут по соседству от семьи Симпсонов. Набожный христианин, Нед является одним из столпов морали Спрингфилда. В эпизоде «Alone Again, Natura-Diddily» он овдовел, его жена Мод погибла в результате несчастного случая.
+</p>
+<p>Нед был одним из первых персонажей в мультсериале, который не был членом семьи Симпсонов. Начиная с первых серий, он регулярно появляется в «Симпсонах». Считается, что Нед Фландерс был назван в честь улицы <em>Northeast Flanders St.</em> в <a href="http://www.portland.gov">Портленде</a>, Орегон, родном городе создателя мультсериала Мэтта Грейнинга]]. Надпись на указателе улицы <em>NE Flanders St.</em> хулиганы часто исправляли на <em>NED Flanders St.</em>
+</p>
+
+
diff --git a/tests/misc/bidi.txt b/tests/misc/bidi.txt
new file mode 100644
index 0000000..f11ff1c
--- /dev/null
+++ b/tests/misc/bidi.txt
@@ -0,0 +1,68 @@
+**Python**(パイソン)は、[Guido van Rossum](http://en.wikipedia.org/wiki/Guido_van_Rossum) によって作られたオープンソースのオブジェクト指向スクリプト言語。[Perl](http://ja.wikipedia.org/wiki/Perl)とともに欧米で広く普及している。イギリスのテレビ局 BBC が製作したコメディ番組『空飛ぶモンティ・パイソン』にちなんで名付けられた。 (Pythonには、爬虫類のニシキヘビの意味があり、Python言語のマスコットやアイコンとして使われることがある。)
+
+|||||||||||||||||||||||||||||THIS SHOULD BE LTR|||||||||||||||||||||||||
+
+|||||||||||||||||||||||||||||THIS SHOULD BE RTL||||||||||||||||||||||||| {@dir=rtl}
+
+
+(**بايثون** لغة برمجة حديثة بسيطة، واضحة، سريعة ، تستخدم أسلوب البرمجة الكائنية (THIS SHOULD BE LTR ) وقابلة للتطوير {@dir=ltr} بالإضافة إلى أنها مجانية و مفتوح
+
+
+
+
+
+پایتون زبان برنامه‌نویسی تفسیری و سطح بالا ، شی‌گرا و یک زبان برنامه‌نویسی تفسیری سمت سرور قدرتمند است که توسط گیدو ون روسوم در سال ۱۹۹۰ ساخته شد. این زبان در ویژگی‌ها شبیه پرل، روبی، اسکیم، اسمال‌تاک و تی‌سی‌ال است و از مدیریت خودکار حافظه استفاده می‌کند
+
+Python,是一种面向对象的、直譯式的计算机程序设计语言,也是一种功能强大而完善的通用型语言,已经具有十多年的发展历史,成熟且稳定。
+
+ބްލޫ ވޭލްގެ ދޫ މަތީގައި އެއްފަހަރާ 50 މީހުންނަށް ތިބެވިދާނެވެ. ބޮޑު މަހުގެ ދުލަކީ އެހާމެ ބޮޑު އެއްޗެކެވެ.
+
+**உருது** 13ஆம் நூற்றாண்டில் உருவான ஒரு இந்தோ-ஐரோப்பிய மொழியாகும். உருது, ஹிந்தியுடன் சேர்த்து "ஹிந்துஸ்தானி" என அழைக்கப்படுகின்றது. மண்டரின், ஆங்கிலம் ஆகியவற்றுக்கு அடுத்தபடியாக மூன்றாவது கூடிய அளவு மக்களால் புரிந்து கொள்ளப்படக்கூடியது ஹிந்துஸ்தானியேயாகும். தாய் மொழியாகப் பேசுபவர்கள் எண்ணிக்கையின் அடிப்படையில் உருது உலகின் 20 ஆவது பெரிய மொழியாகும். 6 கோடி மக்கள் இதனைத் தாய் மொழியாகக் கொண்டுள்ளார்கள். இரண்டாவது மொழியாகக் கொண்டுள்ளவர்கள் உட்பட 11 கோடிப் பேர் இதனைப் பேசுகிறார்கள். உருது பாகிஸ்தானின் அரசகரும மொழியாகவும், இந்தியாவின் அரசகரும மொழிகளுள் ஒன்றாகவும் விளங்குகிறது.
+
+اردو ہندوآریائی زبانوں کی ہندويورپی شاخ کی ایک زبان ہے جو تيرھويں صدی ميں بر صغير ميں پيدا ہوئی ـ اردو پاکستان کی سرکاری زبان ہے اور بھارت کی سرکاری زبانوں ميں سے ايک ہے۔ اردو بھارت ميں 5 کروڑ اور پاکستان ميں 1 کروڑ لوگوں کی مادری زبان ہے مگر اسے بھارت اور پاکستان کے تقریباً 50 کروڑ لوگ بول اور سمجھ سکتے ھیں ۔ جن میں سے تقریباً 10.5 کروڑ لوگ اسے باقاعدہ بولتے ھیں۔
+
+بايثون
+=====
+
+**بايثون** لغة برمجة حديثة بسيطة، واضحة، سريعة ، تستخدم أسلوب البرمجة الكائنية (OOP) وقابلة للتطوير بالإضافة إلى أنها مجانية و مفتوحة المصدر. صُنفت بالأساس كلغة تفسيرية ، بايثون مصممة أصلاً للأداء بعض المهام الخاصة أو المحدودة. إلا أنه يمكن استخدامها بايثون لإنجاز المشاريع الضخمه كأي لغة برمجية أخرى، غالباً ما يُنصح المبتدئين في ميدان البرمجة بتعلم هذه اللغة لأنها من بين أسهل اللغات البرمجية تعلماً.
+
+|||||||||||||||||||||||||||||THIS SHOULD BE RTL|||||||||||||||||||||||||
+
+(نشأت بايثون في مركز CWI (مركز العلوم والحاسب الآلي) بأمستردام على يد جويدو فان رُزوم. تم تطويرها بلغة C. أطلق فان رُزوم اسم "بايثون" على لغته تعبيرًا عن إعجابه بفِرقَة مسرحية هزلية شهيرة من بريطانيا، كانت تطلق على نفسها اسم مونتي بايثون Monty Python.
+
+تتميز بايثون بمجتمعها النشط ، كما أن لها الكثير من المكتبات البرمجية ذات الأغراض الخاصة والتي برمجها أشخاص من مجتمع هذه اللغة ، مثلاً مكتبة PyGame التي توفر مجموعه من الوظائف من اجل برمجة الالعاب. ويمكن لبايثون التعامل مع العديد من أنواع قواعد البيانات مثل MySQL وغيره.
+
+##أمثلة
+مثال Hello World!
+
+ print "Hello World!"
+
+
+مثال لاستخراج المضروب Factorial :
+
+ num = 1
+ x = raw_input('Insert the number please ')
+ x = int(x)
+
+ if x > 69:
+ print 'Math Error !'
+ else:
+ while x > 1:
+ num *= x
+ x = x-1
+
+ print num
+
+
+
+##وصلات خارجية
+* [الموقع الرسمي للغة بايثون](http://www.python.org)
+
+ بذرة حاس
+
+
+**Недвард «Нед» Фландерс** (Nedward «Ned» Flanders) — вымышленный персонаж мультсериала «[Симпсоны][]», озвученный Гарри Ширером. Он и его семья живут по соседству от семьи Симпсонов. Набожный христианин, Нед является одним из столпов морали Спрингфилда. В эпизоде «Alone Again, Natura-Diddily» он овдовел, его жена Мод погибла в результате несчастного случая.
+
+Нед был одним из первых персонажей в мультсериале, который не был членом семьи Симпсонов. Начиная с первых серий, он регулярно появляется в «Симпсонах». Считается, что Нед Фландерс был назван в честь улицы *Northeast Flanders St.* в [Портленде](http://www.portland.gov), Орегон, родном городе создателя мультсериала Мэтта Грейнинга]]. Надпись на указателе улицы *NE Flanders St.* хулиганы часто исправляли на _NED Flanders St._
+
+
diff --git a/tests/misc/blank-block-quote.html b/tests/misc/blank-block-quote.html
new file mode 100644
index 0000000..1544925
--- /dev/null
+++ b/tests/misc/blank-block-quote.html
@@ -0,0 +1,7 @@
+
+<p>aaaaaaaaaaa
+</p>
+<blockquote></blockquote><p>bbbbbbbbbbb
+</p>
+
+
diff --git a/tests/misc/blank-block-quote.txt b/tests/misc/blank-block-quote.txt
new file mode 100644
index 0000000..75bfc74
--- /dev/null
+++ b/tests/misc/blank-block-quote.txt
@@ -0,0 +1,6 @@
+
+aaaaaaaaaaa
+
+>
+
+bbbbbbbbbbb
diff --git a/tests/misc/br.html b/tests/misc/br.html
new file mode 100644
index 0000000..6a521e1
--- /dev/null
+++ b/tests/misc/br.html
@@ -0,0 +1,16 @@
+
+<p>Output:
+</p>
+<pre><code>&lt;p&gt;Some of these words &lt;em&gt;are emphasized&lt;/em&gt;.
+Some of these words &lt;em&gt;are emphasized also&lt;/em&gt;.&lt;/p&gt;
+
+&lt;p&gt;Use two asterisks for &lt;strong&gt;strong emphasis&lt;/strong&gt;.
+Or, if you prefer, &lt;strong&gt;use two underscores instead&lt;/strong&gt;.&lt;/p&gt;
+</code></pre>
+<h2>Lists</h2>
+<p>Unordered (bulleted) lists use asterisks, pluses, and hyphens (<code>*</code>,
+ <code>+</code>, and <code>-</code>) as list markers. These three markers are
+ interchangable; this:
+</p>
+
+
diff --git a/tests/misc/br.txt b/tests/misc/br.txt
new file mode 100644
index 0000000..59d29e0
--- /dev/null
+++ b/tests/misc/br.txt
@@ -0,0 +1,16 @@
+Output:
+
+ <p>Some of these words <em>are emphasized</em>.
+ Some of these words <em>are emphasized also</em>.</p>
+
+ <p>Use two asterisks for <strong>strong emphasis</strong>.
+ Or, if you prefer, <strong>use two underscores instead</strong>.</p>
+
+
+
+## Lists ##
+
+Unordered (bulleted) lists use asterisks, pluses, and hyphens (`*`,
+`+`, and `-`) as list markers. These three markers are
+interchangable; this:
+
diff --git a/tests/misc/comments.html b/tests/misc/comments.html
new file mode 100644
index 0000000..62b830b
--- /dev/null
+++ b/tests/misc/comments.html
@@ -0,0 +1,11 @@
+
+<p>X&lt;0
+</p>
+<p>X&gt;0
+</p>
+<!-- A comment -->
+
+<div>as if</div>
+
+
+
diff --git a/tests/misc/comments.txt b/tests/misc/comments.txt
new file mode 100644
index 0000000..68302b0
--- /dev/null
+++ b/tests/misc/comments.txt
@@ -0,0 +1,7 @@
+X<0
+
+X>0
+
+<!-- A comment -->
+
+<div>as if</div>
diff --git a/tests/misc/div.html b/tests/misc/div.html
new file mode 100644
index 0000000..798024d
--- /dev/null
+++ b/tests/misc/div.html
@@ -0,0 +1,9 @@
+
+<div id="sidebar">
+
+<p> <em>foo</em>
+</p>
+</div>
+
+
+
diff --git a/tests/misc/div.txt b/tests/misc/div.txt
new file mode 100644
index 0000000..ca87745
--- /dev/null
+++ b/tests/misc/div.txt
@@ -0,0 +1,5 @@
+<div id="sidebar">
+
+ _foo_
+
+</div>
diff --git a/tests/misc/email.html b/tests/misc/email.html
new file mode 100644
index 0000000..2fac140
--- /dev/null
+++ b/tests/misc/email.html
@@ -0,0 +1,6 @@
+
+<p>asdfasdfadsfasd <a href="&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#121;&#117;&#114;&#105;&#64;&#102;&#114;&#101;&#101;&#119;&#105;&#115;&#100;&#111;&#109;&#46;&#111;&#114;&#103;">&#121;&#117;&#114;&#105;&#64;&#102;&#114;&#101;&#101;&#119;&#105;&#115;&#100;&#111;&#109;&#46;&#111;&#114;&#103;</a> or you can say
+ instead <a href="&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#121;&#117;&#114;&#105;&#64;&#102;&#114;&#101;&#101;&#119;&#105;&#115;&#100;&#111;&#109;&#46;&#111;&#114;&#103;">&#121;&#117;&#114;&#105;&#64;&#102;&#114;&#101;&#101;&#119;&#105;&#115;&#100;&#111;&#109;&#46;&#111;&#114;&#103;</a>
+</p>
+
+
diff --git a/tests/misc/email.txt b/tests/misc/email.txt
new file mode 100644
index 0000000..ece8801
--- /dev/null
+++ b/tests/misc/email.txt
@@ -0,0 +1,3 @@
+
+asdfasdfadsfasd <yuri@freewisdom.org> or you can say
+instead <mailto:yuri@freewisdom.org>
diff --git a/tests/misc/funky-list.html b/tests/misc/funky-list.html
new file mode 100644
index 0000000..f8f6126
--- /dev/null
+++ b/tests/misc/funky-list.html
@@ -0,0 +1,31 @@
+
+<ol>
+ <li>
+ this starts a list <em>with</em> numbers
+ </li>
+
+ <li>
+ this will show as number &quot;2&quot;
+ </li>
+
+ <li>
+ this will show as number &quot;3.&quot;
+ </li>
+
+ <li>
+ any number, +, -, or * will keep the list going.
+ </li>
+</ol>
+<p>aaaaaaaaaaaaaaa
+</p>
+<ul>
+ <li>
+ now a normal list
+ </li>
+
+ <li>
+ and more
+ </li>
+</ul>
+
+
diff --git a/tests/misc/funky-list.txt b/tests/misc/funky-list.txt
new file mode 100644
index 0000000..48ecd60
--- /dev/null
+++ b/tests/misc/funky-list.txt
@@ -0,0 +1,9 @@
+1. this starts a list *with* numbers
++ this will show as number "2"
+* this will show as number "3."
+9. any number, +, -, or * will keep the list going.
+
+aaaaaaaaaaaaaaa
+
+- now a normal list
+- and more
diff --git a/tests/misc/h1.html b/tests/misc/h1.html
new file mode 100644
index 0000000..f3110f8
--- /dev/null
+++ b/tests/misc/h1.html
@@ -0,0 +1,9 @@
+
+
+<h2>Header</h2>
+
+<h1>Header 2</h1>
+
+<h3>H3</h3>
+
+
diff --git a/tests/misc/h1.txt b/tests/misc/h1.txt
new file mode 100644
index 0000000..0a1c8f9
--- /dev/null
+++ b/tests/misc/h1.txt
@@ -0,0 +1,7 @@
+Header
+------
+
+Header 2
+========
+
+### H3
diff --git a/tests/misc/hash.html b/tests/misc/hash.html
new file mode 100644
index 0000000..b78babc
--- /dev/null
+++ b/tests/misc/hash.html
@@ -0,0 +1,18 @@
+
+<p>a
+</p>
+<pre>
+#!/usr/bin/python
+
+hello</pre>
+
+<p>a
+</p>
+<pre>
+!/usr/bin/python
+hello</pre>
+
+<p>a
+</p>
+
+
diff --git a/tests/misc/hash.txt b/tests/misc/hash.txt
new file mode 100644
index 0000000..634758d
--- /dev/null
+++ b/tests/misc/hash.txt
@@ -0,0 +1,13 @@
+a
+
+<pre>
+#!/usr/bin/python
+hello</pre>
+
+a
+
+<pre>
+!/usr/bin/python
+hello</pre>
+
+a
diff --git a/tests/misc/headers.html b/tests/misc/headers.html
new file mode 100644
index 0000000..306eb65
--- /dev/null
+++ b/tests/misc/headers.html
@@ -0,0 +1,14 @@
+
+
+<h3>Hello world</h3>
+<p>Line 2
+ Line 3
+</p>
+
+<h1>[Markdown][5] <br /></h1>
+
+<h1><a href="http://some.link.com/">Markdown</a></h1>
+
+<h1>[5]: http://foo.com/</h1>
+
+
diff --git a/tests/misc/headers.txt b/tests/misc/headers.txt
new file mode 100644
index 0000000..1cb9bc0
--- /dev/null
+++ b/tests/misc/headers.txt
@@ -0,0 +1,9 @@
+### Hello world
+Line 2
+Line 3
+
+# [Markdown][5]
+
+# [Markdown](http://some.link.com/)
+
+# [5]: http://foo.com/
diff --git a/tests/misc/hline.html b/tests/misc/hline.html
new file mode 100644
index 0000000..8d33101
--- /dev/null
+++ b/tests/misc/hline.html
@@ -0,0 +1,7 @@
+
+
+<h1>Header</h1>
+<p>Next line
+</p>
+
+
diff --git a/tests/misc/hline.txt b/tests/misc/hline.txt
new file mode 100644
index 0000000..e39b7a2
--- /dev/null
+++ b/tests/misc/hline.txt
@@ -0,0 +1,5 @@
+
+#Header
+Next line
+
+
diff --git a/tests/misc/html.html b/tests/misc/html.html
new file mode 100644
index 0000000..6db122a
--- /dev/null
+++ b/tests/misc/html.html
@@ -0,0 +1,13 @@
+
+<h1>Block level html</h1>
+
+<p>Some inline <b>stuff<b>. <br />
+</p>
+<p>Now some <arbitrary>arbitrary tags</arbitrary>.
+</p>
+<p>And of course <script>blah</script>.
+</p>
+<p><a href="script&gt;stuff&lt;/script">this <script>link</a>
+</p>
+
+
diff --git a/tests/misc/html.txt b/tests/misc/html.txt
new file mode 100644
index 0000000..5ce7bb2
--- /dev/null
+++ b/tests/misc/html.txt
@@ -0,0 +1,10 @@
+
+<h1>Block level html</h1>
+
+Some inline <b>stuff<b>.
+
+Now some <arbitrary>arbitrary tags</arbitrary>.
+
+And of course <script>blah</script>.
+
+[this <script>link](<script>stuff</script>) \ No newline at end of file
diff --git a/tests/misc/image-2.html b/tests/misc/image-2.html
new file mode 100644
index 0000000..ddc8f3f
--- /dev/null
+++ b/tests/misc/image-2.html
@@ -0,0 +1,7 @@
+
+<p><a href="http://src.com/"><em>link!</em></a>
+</p>
+<p>*<a href="http://www.freewisdom.org">link</a>*
+</p>
+
+
diff --git a/tests/misc/image-2.txt b/tests/misc/image-2.txt
new file mode 100644
index 0000000..6228383
--- /dev/null
+++ b/tests/misc/image-2.txt
@@ -0,0 +1,3 @@
+[*link!*](http://src.com/)
+
+*[link](http://www.freewisdom.org)*
diff --git a/tests/misc/image.html b/tests/misc/image.html
new file mode 100644
index 0000000..0f449a5
--- /dev/null
+++ b/tests/misc/image.html
@@ -0,0 +1,5 @@
+
+<p><img src="http://humane_man.jpg" title="The most humane man." alt="Poster"/>
+</p>
+
+
diff --git a/tests/misc/image.txt b/tests/misc/image.txt
new file mode 100644
index 0000000..5553bd4
--- /dev/null
+++ b/tests/misc/image.txt
@@ -0,0 +1,2 @@
+
+![Poster](http://humane_man.jpg "The most humane man.")
diff --git a/tests/misc/image_in_links.html b/tests/misc/image_in_links.html
new file mode 100644
index 0000000..fde1416
--- /dev/null
+++ b/tests/misc/image_in_links.html
@@ -0,0 +1,5 @@
+
+<p>[<img src="path/to/img_thumb.png" alt="altname"/>](path/to/image.png)
+</p>
+
+
diff --git a/tests/misc/image_in_links.txt b/tests/misc/image_in_links.txt
new file mode 100644
index 0000000..6d739e6
--- /dev/null
+++ b/tests/misc/image_in_links.txt
@@ -0,0 +1,3 @@
+
+
+[![altname](path/to/img_thumb.png)](path/to/image.png)
diff --git a/tests/misc/inside_html.html b/tests/misc/inside_html.html
new file mode 100644
index 0000000..5e128ab
--- /dev/null
+++ b/tests/misc/inside_html.html
@@ -0,0 +1,5 @@
+
+<p><a href="stuff"> <strong>ok</strong>? </a>
+</p>
+
+
diff --git a/tests/misc/inside_html.txt b/tests/misc/inside_html.txt
new file mode 100644
index 0000000..4f068bf
--- /dev/null
+++ b/tests/misc/inside_html.txt
@@ -0,0 +1 @@
+<a href="stuff"> __ok__? </a>
diff --git a/tests/misc/japanese.html b/tests/misc/japanese.html
new file mode 100644
index 0000000..c23effd
--- /dev/null
+++ b/tests/misc/japanese.html
@@ -0,0 +1,28 @@
+
+
+<h1>パイソン (Python)</h1>
+<p><strong>Python</strong>(パイソン)は、<a href="http://en.wikipedia.org/wiki/Guido_van_Rossum">Guido van Rossum</a> によって作られたオープンソースのオブジェクト指向スクリプト言語。<a href="http://ja.wikipedia.org/wiki/Perl">Perl</a>とともに欧米で広く普及している。イギリスのテレビ局 BBC が製作したコメディ番組『空飛ぶモンティ・パイソン』にちなんで名付けられた。 (Pythonには、爬虫類のニシキヘビの意味があり、Python言語のマスコットやアイコンとして使われることがある。)
+</p>
+
+<h2>概要</h2>
+<p>プログラミング言語 Python は初心者から専門家まで幅広いユーザ層を獲得している。利用目的は汎用で、方向性としてはJavaに近い。ただし、最初からネットワーク利用をメインとして考えられているJavaよりセキュリティについてはやや寛大である。多くのプラットフォームをサポートしており(⇒<a href="#somelink">動作するプラットフォーム</a>)、豊富なライブラリがあることから、産業界でも利用が増えつつある。また、Pythonは純粋なプログラミング言語のほかにも、多くの異なる言語で書かれたモジュールをまとめる糊言語のひとつとして位置づけることができる。実際Pythonは多くの商用アプリケーションでスクリプト言語として採用されている(⇒Pythonを使っている製品あるいはソフトウェアの一覧)。豊富なドキュメントをもち、Unicodeによる文字列操作をサポートしており、日本語処理も標準で可能である。
+</p>
+<p>Python は基本的にインタプリタ上で実行されることを念頭において設計されており、以下のような特徴をもっている:
+</p>
+<ul>
+ <li>
+ 動的な型付け。
+ </li>
+
+ <li>
+ オブジェクトのメンバに対するアクセスが制限されていない。(属性や専用のメソッドフックを実装することによって制限は可能。)
+ </li>
+
+ <li>
+ モジュール、クラス、オブジェクト等の言語の要素が内部からアクセス可能であり、リフレクションを利用した記述が可能。
+ </li>
+</ul>
+<p>また、Pythonではインデントによりブロックを指定する構文を採用している(⇒<a href="#jklj">オフサイドルール</a>)。この構文はPythonに慣れたユーザからは称賛をもって受け入れられているが、他の言語のユーザからは批判も多い。このほかにも、大きすぎる実行ファイルや、Javaに比べて遅い処理速度などが欠点として指摘されている。しかし <strong>プロトタイピング</strong> の際にはこれらの点はさして問題とはならないことから、研究開発部門では頻繁に利用されている。
+</p>
+
+
diff --git a/tests/misc/japanese.txt b/tests/misc/japanese.txt
new file mode 100644
index 0000000..b2bd38c
--- /dev/null
+++ b/tests/misc/japanese.txt
@@ -0,0 +1,15 @@
+パイソン (Python)
+=======
+
+**Python**(パイソン)は、[Guido van Rossum](http://en.wikipedia.org/wiki/Guido_van_Rossum) によって作られたオープンソースのオブジェクト指向スクリプト言語。[Perl](http://ja.wikipedia.org/wiki/Perl)とともに欧米で広く普及している。イギリスのテレビ局 BBC が製作したコメディ番組『空飛ぶモンティ・パイソン』にちなんで名付けられた。 (Pythonには、爬虫類のニシキヘビの意味があり、Python言語のマスコットやアイコンとして使われることがある。)
+
+## 概要
+プログラミング言語 Python は初心者から専門家まで幅広いユーザ層を獲得している。利用目的は汎用で、方向性としてはJavaに近い。ただし、最初からネットワーク利用をメインとして考えられているJavaよりセキュリティについてはやや寛大である。多くのプラットフォームをサポートしており(⇒[動作するプラットフォーム](#somelink))、豊富なライブラリがあることから、産業界でも利用が増えつつある。また、Pythonは純粋なプログラミング言語のほかにも、多くの異なる言語で書かれたモジュールをまとめる糊言語のひとつとして位置づけることができる。実際Pythonは多くの商用アプリケーションでスクリプト言語として採用されている(⇒Pythonを使っている製品あるいはソフトウェアの一覧)。豊富なドキュメントをもち、Unicodeによる文字列操作をサポートしており、日本語処理も標準で可能である。
+
+Python は基本的にインタプリタ上で実行されることを念頭において設計されており、以下のような特徴をもっている:
+
+* 動的な型付け。
+* オブジェクトのメンバに対するアクセスが制限されていない。(属性や専用のメソッドフックを実装することによって制限は可能。)
+* モジュール、クラス、オブジェクト等の言語の要素が内部からアクセス可能であり、リフレクションを利用した記述が可能。
+
+また、Pythonではインデントによりブロックを指定する構文を採用している(⇒[オフサイドルール](#jklj))。この構文はPythonに慣れたユーザからは称賛をもって受け入れられているが、他の言語のユーザからは批判も多い。このほかにも、大きすぎる実行ファイルや、Javaに比べて遅い処理速度などが欠点として指摘されている。しかし **プロトタイピング** の際にはこれらの点はさして問題とはならないことから、研究開発部門では頻繁に利用されている。
diff --git a/tests/misc/lists.html b/tests/misc/lists.html
new file mode 100644
index 0000000..fa4be24
--- /dev/null
+++ b/tests/misc/lists.html
@@ -0,0 +1,64 @@
+
+<ul>
+ <li>
+ A multi-paragraph list,
+ unindented.
+ </li>
+</ul>
+<p>Simple tight list
+</p>
+<ul>
+ <li>
+ Uno
+ </li>
+
+ <li>
+ Due
+ </li>
+
+ <li>
+ Tri
+ </li>
+</ul>
+<p>A singleton tight list:
+</p>
+<ul>
+ <li>
+ Uno
+ </li>
+</ul>
+<p>A lose list:
+</p>
+<ul>
+ <li><p>One
+</p>
+
+ </li>
+
+ <li><p>Two
+</p>
+
+ </li>
+
+ <li><p>Three
+</p>
+
+ </li>
+</ul>
+<p>A lose list with paragraphs
+</p>
+<ul>
+ <li><p>One one one one
+</p>
+<p>one one one one
+</p>
+
+ </li>
+
+ <li><p>Two two two two
+</p>
+
+ </li>
+</ul>
+
+
diff --git a/tests/misc/lists.txt b/tests/misc/lists.txt
new file mode 100644
index 0000000..6db0dc3
--- /dev/null
+++ b/tests/misc/lists.txt
@@ -0,0 +1,31 @@
+
+* A multi-paragraph list,
+unindented.
+
+
+
+Simple tight list
+
+* Uno
+* Due
+* Tri
+
+A singleton tight list:
+
+* Uno
+
+A lose list:
+
+* One
+
+* Two
+
+* Three
+
+A lose list with paragraphs
+
+* One one one one
+
+ one one one one
+
+* Two two two two
diff --git a/tests/misc/lists2.html b/tests/misc/lists2.html
new file mode 100644
index 0000000..dcc2f81
--- /dev/null
+++ b/tests/misc/lists2.html
@@ -0,0 +1,10 @@
+
+<ul>
+ <li>
+ blah blah blah
+ sdf asdf asdf asdf asdf
+ asda asdf asdfasd
+ </li>
+</ul>
+
+
diff --git a/tests/misc/lists2.txt b/tests/misc/lists2.txt
new file mode 100644
index 0000000..cbff761
--- /dev/null
+++ b/tests/misc/lists2.txt
@@ -0,0 +1,3 @@
+* blah blah blah
+sdf asdf asdf asdf asdf
+asda asdf asdfasd
diff --git a/tests/misc/lists3.html b/tests/misc/lists3.html
new file mode 100644
index 0000000..dcc2f81
--- /dev/null
+++ b/tests/misc/lists3.html
@@ -0,0 +1,10 @@
+
+<ul>
+ <li>
+ blah blah blah
+ sdf asdf asdf asdf asdf
+ asda asdf asdfasd
+ </li>
+</ul>
+
+
diff --git a/tests/misc/lists3.txt b/tests/misc/lists3.txt
new file mode 100644
index 0000000..6b45bd4
--- /dev/null
+++ b/tests/misc/lists3.txt
@@ -0,0 +1,3 @@
+* blah blah blah
+ sdf asdf asdf asdf asdf
+ asda asdf asdfasd
diff --git a/tests/misc/lists4.html b/tests/misc/lists4.html
new file mode 100644
index 0000000..399ca9c
--- /dev/null
+++ b/tests/misc/lists4.html
@@ -0,0 +1,21 @@
+
+<ul>
+ <li>
+ item1
+ </li>
+
+ <li>
+ item2<ol>
+ <li>
+ Number 1
+ </li>
+
+ <li>
+ Number 2
+ </li>
+</ol>
+
+ </li>
+</ul>
+
+
diff --git a/tests/misc/lists4.txt b/tests/misc/lists4.txt
new file mode 100644
index 0000000..a21493d
--- /dev/null
+++ b/tests/misc/lists4.txt
@@ -0,0 +1,5 @@
+
+* item1
+* item2
+ 1. Number 1
+ 2. Number 2
diff --git a/tests/misc/lists5.html b/tests/misc/lists5.html
new file mode 100644
index 0000000..460a27d
--- /dev/null
+++ b/tests/misc/lists5.html
@@ -0,0 +1,21 @@
+
+<blockquote><p>This is a test of a block quote
+ With just two lines
+</p>
+</blockquote><p>A paragraph
+</p>
+<blockquote><p>This is a more difficult case
+ With a list item inside the quote
+</p>
+<ul>
+ <li>
+ Alpha
+ </li>
+
+ <li>
+ Beta
+ Etc.
+ </li>
+</ul>
+</blockquote>
+
diff --git a/tests/misc/lists5.txt b/tests/misc/lists5.txt
new file mode 100644
index 0000000..566e0f1
--- /dev/null
+++ b/tests/misc/lists5.txt
@@ -0,0 +1,12 @@
+> This is a test of a block quote
+> With just two lines
+
+A paragraph
+
+> This is a more difficult case
+> With a list item inside the quote
+>
+> * Alpha
+> * Beta
+> Etc.
+
diff --git a/tests/misc/markup-inside-p.html b/tests/misc/markup-inside-p.html
new file mode 100644
index 0000000..6cd0547
--- /dev/null
+++ b/tests/misc/markup-inside-p.html
@@ -0,0 +1,25 @@
+
+<p>
+
+_foo_
+
+</p>
+
+<p>
+_foo_
+</p>
+
+<p>_foo_</p>
+
+<p>
+
+_foo_
+</p>
+
+<p>
+_foo_
+
+</p>
+
+
+
diff --git a/tests/misc/markup-inside-p.txt b/tests/misc/markup-inside-p.txt
new file mode 100644
index 0000000..ab7dd0f
--- /dev/null
+++ b/tests/misc/markup-inside-p.txt
@@ -0,0 +1,21 @@
+<p>
+
+_foo_
+
+</p>
+
+<p>
+_foo_
+</p>
+
+<p>_foo_</p>
+
+<p>
+
+_foo_
+</p>
+
+<p>
+_foo_
+
+</p>
diff --git a/tests/misc/more_comments.html b/tests/misc/more_comments.html
new file mode 100644
index 0000000..b28b04f
--- /dev/null
+++ b/tests/misc/more_comments.html
@@ -0,0 +1,3 @@
+
+
+
diff --git a/tests/misc/more_comments.txt b/tests/misc/more_comments.txt
new file mode 100644
index 0000000..0397f9c
--- /dev/null
+++ b/tests/misc/more_comments.txt
@@ -0,0 +1,9 @@
+<!--asd@asdfd.com>
+
+
+<!asd@asdfd.com>
+
+
+<asd!@asdfd.com>
+
+Test
diff --git a/tests/misc/multi-line-tags.html b/tests/misc/multi-line-tags.html
new file mode 100644
index 0000000..d47e1e2
--- /dev/null
+++ b/tests/misc/multi-line-tags.html
@@ -0,0 +1,9 @@
+
+<div>
+
+<p>asdf asdfasd
+</p>
+</div>
+
+
+
diff --git a/tests/misc/multi-line-tags.txt b/tests/misc/multi-line-tags.txt
new file mode 100644
index 0000000..4ea3b02
--- /dev/null
+++ b/tests/misc/multi-line-tags.txt
@@ -0,0 +1,6 @@
+
+<div>
+
+asdf asdfasd
+
+</div>
diff --git a/tests/misc/multi-test.html b/tests/misc/multi-test.html
new file mode 100644
index 0000000..5af759b
--- /dev/null
+++ b/tests/misc/multi-test.html
@@ -0,0 +1,37 @@
+
+
+<h1 id="inthebeginning">Header </h1>
+<p>Now, let's try something <em class="special">inline</em>, to see if it works
+</p>
+<p>Blah blah blah <a href="http://www.slashdot.org">http://www.slashdot.org</a>
+</p>
+<ul>
+ <li>
+ Basic list
+ </li>
+
+ <li>
+ Basic list 2
+ </li>
+</ul>
+<p>addss
+</p>
+<ul>
+ <li>
+ Lazy list
+ </li>
+</ul>
+<p>An <a href="http://example.com" title="Title">example</a> (oops)
+</p>
+<p>Now, let's use a footnote[^1]. Not bad, eh?
+ Let's continue.
+</p>
+<p> [^1]: Here is the text of the footnote
+ continued on several lines.
+ some more of the footnote, etc.
+</p>
+<pre><code>Actually, another paragraph too.
+</code></pre><p>And then there is a little bit of text.
+</p>
+
+
diff --git a/tests/misc/multi-test.txt b/tests/misc/multi-test.txt
new file mode 100644
index 0000000..c4ab1c1
--- /dev/null
+++ b/tests/misc/multi-test.txt
@@ -0,0 +1,32 @@
+
+# Header {@id=inthebeginning}
+
+Now, let's try something *inline{@class=special}*, to see if it works
+
+
+Blah blah blah <http://www.slashdot.org>
+
+* Basic list
+* Basic list 2
+
+addss
+
+ * Lazy list
+
+An [example][ref] (oops)
+
+ [ref]: http://example.com "Title"
+
+
+Now, let's use a footnote[^1]. Not bad, eh?
+Let's continue.
+
+ [^1]: Here is the text of the footnote
+ continued on several lines.
+ some more of the footnote, etc.
+
+ Actually, another paragraph too.
+
+And then there is a little bit of text.
+
+
diff --git a/tests/misc/multiline-comments.html b/tests/misc/multiline-comments.html
new file mode 100644
index 0000000..14d2a62
--- /dev/null
+++ b/tests/misc/multiline-comments.html
@@ -0,0 +1,21 @@
+
+<!--
+
+foo
+
+-->
+
+<p>
+
+foo
+
+</p>
+
+<div>
+
+<p>foo
+</p>
+</div>
+
+
+
diff --git a/tests/misc/multiline-comments.txt b/tests/misc/multiline-comments.txt
new file mode 100644
index 0000000..71bc418
--- /dev/null
+++ b/tests/misc/multiline-comments.txt
@@ -0,0 +1,18 @@
+<!--
+
+foo
+
+-->
+
+<p>
+
+foo
+
+</p>
+
+
+<div>
+
+foo
+
+</div>
diff --git a/tests/misc/normalize.html b/tests/misc/normalize.html
new file mode 100644
index 0000000..b151cf9
--- /dev/null
+++ b/tests/misc/normalize.html
@@ -0,0 +1,5 @@
+
+<p><a href="http://www.stuff.com/q?x=1&amp;y=2&lt;&gt;">Link</a>
+</p>
+
+
diff --git a/tests/misc/normalize.txt b/tests/misc/normalize.txt
new file mode 100644
index 0000000..fe0cf17
--- /dev/null
+++ b/tests/misc/normalize.txt
@@ -0,0 +1,2 @@
+
+[Link](http://www.stuff.com/q?x=1&y=2<>)
diff --git a/tests/misc/numeric-entity.html b/tests/misc/numeric-entity.html
new file mode 100644
index 0000000..34d4e97
--- /dev/null
+++ b/tests/misc/numeric-entity.html
@@ -0,0 +1,7 @@
+
+<p><a href="&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#117;&#115;&#101;&#114;&#64;&#103;&#109;&#97;&#105;&#108;&#46;&#99;&#111;&#109;">&#117;&#115;&#101;&#114;&#64;&#103;&#109;&#97;&#105;&#108;&#46;&#99;&#111;&#109;</a>
+</p>
+<p>This is an entity: &#234;
+</p>
+
+
diff --git a/tests/misc/numeric-entity.txt b/tests/misc/numeric-entity.txt
new file mode 100644
index 0000000..9afdbc7
--- /dev/null
+++ b/tests/misc/numeric-entity.txt
@@ -0,0 +1,4 @@
+
+<user@gmail.com>
+
+This is an entity: &#234;
diff --git a/tests/misc/php.html b/tests/misc/php.html
new file mode 100644
index 0000000..2ad3339
--- /dev/null
+++ b/tests/misc/php.html
@@ -0,0 +1,16 @@
+
+<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
+ "http://www.w3.org/TR/html4/strict.dtd">
+
+<b>This should have a p tag</b>
+
+<!--This is a comment -->
+
+<div>This shouldn't</div>
+
+<?php echo "block_level";?>
+
+<p> &lt;?php echo &quot;not_block_level&quot;;?&gt;
+</p>
+
+
diff --git a/tests/misc/php.txt b/tests/misc/php.txt
new file mode 100644
index 0000000..ca5be45
--- /dev/null
+++ b/tests/misc/php.txt
@@ -0,0 +1,13 @@
+<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
+ "http://www.w3.org/TR/html4/strict.dtd">
+
+<b>This should have a p tag</b>
+
+<!--This is a comment -->
+
+<div>This shouldn't</div>
+
+<?php echo "block_level";?>
+
+ <?php echo "not_block_level";?>
+
diff --git a/tests/misc/pre.html b/tests/misc/pre.html
new file mode 100644
index 0000000..01f5a29
--- /dev/null
+++ b/tests/misc/pre.html
@@ -0,0 +1,17 @@
+
+<pre>
+
+aaa
+
+bbb
+</pre>
+
+<pre>
+* and this is pre-formatted content
+* and it should be printed just like this
+* and not formatted as a list
+
+</pre>
+
+
+
diff --git a/tests/misc/pre.txt b/tests/misc/pre.txt
new file mode 100644
index 0000000..31243b5
--- /dev/null
+++ b/tests/misc/pre.txt
@@ -0,0 +1,14 @@
+<pre>
+
+aaa
+
+bbb
+</pre>
+
+<pre>
+* and this is pre-formatted content
+* and it should be printed just like this
+* and not formatted as a list
+
+</pre>
+
diff --git a/tests/misc/russian.html b/tests/misc/russian.html
new file mode 100644
index 0000000..01656e3
--- /dev/null
+++ b/tests/misc/russian.html
@@ -0,0 +1,15 @@
+
+
+<h1>Недвард «Нед» Фландерс</h1>
+<p><strong>Недвард «Нед» Фландерс</strong> (Nedward «Ned» Flanders) — вымышленный персонаж мультсериала «[Симпсоны][]», озвученный Гарри Ширером. Он и его семья живут по соседству от семьи Симпсонов. Набожный христианин, Нед является одним из столпов морали Спрингфилда. В эпизоде «Alone Again, Natura-Diddily» он овдовел, его жена Мод погибла в результате несчастного случая.
+</p>
+<p>Нед был одним из первых персонажей в мультсериале, который не был членом семьи Симпсонов. Начиная с первых серий, он регулярно появляется в «Симпсонах». Считается, что Нед Фландерс был назван в честь улицы <em>Northeast Flanders St.</em> в <a href="http://www.portland.gov">Портленде</a>, Орегон, родном городе создателя мультсериала Мэтта Грейнинга]]. Надпись на указателе улицы <em>NE Flanders St.</em> хулиганы часто исправляли на <em>NED Flanders St.</em>
+</p>
+
+<h2>Биография</h2>
+<p>Нед Фландерс родился в Нью-Йорке, его родители были битниками. Его отец в точности похож на взрослого Неда, только он носил козлиную бородку. Их отказ от воспитания Неда и то, что они, в общем-то, были плохими родителями («мы ничего в этом не понимаем и не знаем как начать») привело к тому, что Нед превратился в ужасного сорванца. В конце концов они согласились на экспериментальную восьмимесячную шлепологическую терапию Миннесотского Университета (воспоминания Неда в эпизоде «Hurricane Neddy»), которая научила его подавлять чувство злости. Побочным эфектом терапии стало то, что Нед стал ненавидеть своих родителей (это одна из двух вещей которые ненавидит Фландерс, вторая — отделения почты, чьи длинные очереди, суета и угрюмый персонал раздражают его).
+</p>
+<p>У Неда есть странная привычка добавлять «дидли», «дадли» и другие бессмысленные слова в свои фразы при разговоре, например: «Hi-diddly-ho, neighbor-ino» («Приветик, соседушка»). Это результат сублимации его злости, вызванной сдерживанием гнева, который не имеет никакого другого выхода.
+</p>
+
+
diff --git a/tests/misc/russian.txt b/tests/misc/russian.txt
new file mode 100644
index 0000000..a742065
--- /dev/null
+++ b/tests/misc/russian.txt
@@ -0,0 +1,15 @@
+Недвард «Нед» Фландерс
+======================
+
+
+**Недвард «Нед» Фландерс** (Nedward «Ned» Flanders) — вымышленный персонаж мультсериала «[Симпсоны][]», озвученный Гарри Ширером. Он и его семья живут по соседству от семьи Симпсонов. Набожный христианин, Нед является одним из столпов морали Спрингфилда. В эпизоде «Alone Again, Natura-Diddily» он овдовел, его жена Мод погибла в результате несчастного случая.
+
+Нед был одним из первых персонажей в мультсериале, который не был членом семьи Симпсонов. Начиная с первых серий, он регулярно появляется в «Симпсонах». Считается, что Нед Фландерс был назван в честь улицы *Northeast Flanders St.* в [Портленде](http://www.portland.gov), Орегон, родном городе создателя мультсериала Мэтта Грейнинга]]. Надпись на указателе улицы *NE Flanders St.* хулиганы часто исправляли на _NED Flanders St._
+
+## Биография
+
+Нед Фландерс родился в Нью-Йорке, его родители были битниками. Его отец в точности похож на взрослого Неда, только он носил козлиную бородку. Их отказ от воспитания Неда и то, что они, в общем-то, были плохими родителями («мы ничего в этом не понимаем и не знаем как начать») привело к тому, что Нед превратился в ужасного сорванца. В конце концов они согласились на экспериментальную восьмимесячную шлепологическую терапию Миннесотского Университета (воспоминания Неда в эпизоде «Hurricane Neddy»), которая научила его подавлять чувство злости. Побочным эфектом терапии стало то, что Нед стал ненавидеть своих родителей (это одна из двух вещей которые ненавидит Фландерс, вторая — отделения почты, чьи длинные очереди, суета и угрюмый персонал раздражают его).
+
+У Неда есть странная привычка добавлять «дидли», «дадли» и другие бессмысленные слова в свои фразы при разговоре, например: «Hi-diddly-ho, neighbor-ino» («Приветик, соседушка»). Это результат сублимации его злости, вызванной сдерживанием гнева, который не имеет никакого другого выхода.
+
+
diff --git a/tests/misc/some-test.html b/tests/misc/some-test.html
new file mode 100644
index 0000000..9a6655e
--- /dev/null
+++ b/tests/misc/some-test.html
@@ -0,0 +1,105 @@
+
+<hr />
+
+<ul>
+ <li><p>as if
+</p>
+
+ </li>
+
+ <li><p>as if2
+</p>
+
+ </li>
+</ul>
+<hr />
+
+<ul>
+ <li><p>as if
+</p>
+
+ </li>
+
+ <li><p>as if2
+</p>
+
+ </li>
+</ul>
+<hr />
+
+<ul>
+ <li>
+ as if
+ non_code
+ </li>
+
+ <li>
+ as if2
+ </li>
+</ul>
+<p>Markdown
+</p>
+<ul>
+ <li><p>Python
+ is ok
+</p>
+<ul>
+ <li>
+ Therefore i am
+ </li>
+</ul>
+
+ </li>
+
+ <li><p>Perl sucks
+ big time
+</p>
+<ul>
+ <li>
+ But that's
+ ok
+ </li>
+</ul>
+
+ </li>
+
+ <li><p>Python is
+ ok
+ Or not?
+ <br />
+ Here is a normal paragraph
+</p>
+
+ </li>
+
+ <li><p>Another list
+ with a bunch of items
+</p>
+
+ </li>
+
+ <li><p>Mostly fruits
+</p>
+<ol>
+ <li>
+ Apple
+ </li>
+
+ <li>
+ Pare
+ </li>
+</ol>
+
+ </li>
+</ul>
+<p>asdfasdfasd
+</p>
+<pre><code># This is a code example
+import stuff
+
+Another code example
+* Lists and similar stuff
+
+&gt; Should be ignored
+</code></pre>
+
diff --git a/tests/misc/some-test.txt b/tests/misc/some-test.txt
new file mode 100644
index 0000000..0708817
--- /dev/null
+++ b/tests/misc/some-test.txt
@@ -0,0 +1,57 @@
+----------------------
+
+* as if
+
+* as if2
+
+----------------------
+
+* as if
+
+* as if2
+
+----------------------
+
+* as if
+ non_code
+* as if2
+
+
+
+
+Markdown
+
+* Python
+ is ok
+ * Therefore i am
+
+* Perl sucks
+ big time
+ * But that's
+ ok
+
+* Python is
+ok
+ Or not?
+
+Here is a normal paragraph
+
+1. Another list
+with a bunch of items
+2. Mostly fruits
+
+
+
+ 3. Apple
+ 4. Pare
+
+asdfasdfasd
+
+
+ # This is a code example
+ import stuff
+
+ Another code example
+ * Lists and similar stuff
+
+ > Should be ignored
diff --git a/tests/misc/span.html b/tests/misc/span.html
new file mode 100644
index 0000000..354f926
--- /dev/null
+++ b/tests/misc/span.html
@@ -0,0 +1,11 @@
+
+<p><span id="someId"> Foo <em>bar</em> Baz </span>
+</p>
+<div><b>*foo*</b></div>
+
+<div id="someId"> Foo *bar* Baz </div>
+
+<p><baza id="someId"> Foo <em>bar</em> Baz </baza>
+</p>
+
+
diff --git a/tests/misc/span.txt b/tests/misc/span.txt
new file mode 100644
index 0000000..62bcf9b
--- /dev/null
+++ b/tests/misc/span.txt
@@ -0,0 +1,10 @@
+
+<span id="someId"> Foo *bar* Baz </span>
+
+<div><b>*foo*</b></div>
+
+<div id="someId"> Foo *bar* Baz </div>
+
+<baza id="someId"> Foo *bar* Baz </baza>
+
+
diff --git a/tests/misc/stronintags.html b/tests/misc/stronintags.html
new file mode 100644
index 0000000..8f64e04
--- /dev/null
+++ b/tests/misc/stronintags.html
@@ -0,0 +1,10 @@
+
+<p>this is a <a href="http://example.com/"><strong>test</strong></a>
+</p>
+<p>this is a second <em></em><a href="http://example.com">test</a><em></em>
+</p>
+<p>reference <strong>[test][]</strong>
+ reference [<strong>test</strong>][]
+</p>
+
+
diff --git a/tests/misc/stronintags.txt b/tests/misc/stronintags.txt
new file mode 100644
index 0000000..01c118f
--- /dev/null
+++ b/tests/misc/stronintags.txt
@@ -0,0 +1,8 @@
+this is a [**test**](http://example.com/)
+
+this is a second **[test](http://example.com)**
+
+reference **[test][]**
+reference [**test**][]
+
+
diff --git a/tests/misc/tabs-in-lists.html b/tests/misc/tabs-in-lists.html
new file mode 100644
index 0000000..7f61928
--- /dev/null
+++ b/tests/misc/tabs-in-lists.html
@@ -0,0 +1,67 @@
+
+<p>First a list with a tabbed line
+</p>
+<ul>
+ <li><p>A
+</p>
+
+ </li>
+
+ <li><p>B
+</p>
+
+ </li>
+</ul>
+<p>Just a blank line:
+</p>
+<ul>
+ <li><p>A
+</p>
+
+ </li>
+
+ <li><p>B
+</p>
+
+ </li>
+</ul>
+<p>Now a list with 4 spaces and some text:
+</p>
+<ul>
+ <li>
+ A
+ abcdef
+ </li>
+
+ <li>
+ B
+ </li>
+</ul>
+<p>Now with a tab and an extra space:
+</p>
+<ul>
+ <li><p>A
+</p>
+
+ </li>
+
+ <li><p>B
+</p>
+
+ </li>
+</ul>
+<p>Now a list with 4 spaces:
+</p>
+<ul>
+ <li><p>A
+</p>
+
+ </li>
+
+ <li><p>B
+</p>
+
+ </li>
+</ul>
+
+
diff --git a/tests/misc/tabs-in-lists.txt b/tests/misc/tabs-in-lists.txt
new file mode 100644
index 0000000..05fde23
--- /dev/null
+++ b/tests/misc/tabs-in-lists.txt
@@ -0,0 +1,32 @@
+First a list with a tabbed line
+
+* A
+
+* B
+
+Just a blank line:
+
+* A
+
+* B
+
+
+Now a list with 4 spaces and some text:
+
+* A
+ abcdef
+* B
+
+
+Now with a tab and an extra space:
+
+* A
+
+* B
+
+Now a list with 4 spaces:
+
+* A
+
+* B
+
diff --git a/tests/misc/two-spaces.html b/tests/misc/two-spaces.html
new file mode 100644
index 0000000..10f8483
--- /dev/null
+++ b/tests/misc/two-spaces.html
@@ -0,0 +1,9 @@
+
+<p>This line has two spaces at the end <br />
+ but this one has none
+ but this line has three <br />
+ and this is the second from last line
+ in this test message
+</p>
+
+
diff --git a/tests/misc/two-spaces.txt b/tests/misc/two-spaces.txt
new file mode 100644
index 0000000..103395b
--- /dev/null
+++ b/tests/misc/two-spaces.txt
@@ -0,0 +1,6 @@
+This line has two spaces at the end
+but this one has none
+but this line has three
+and this is the second from last line
+in this test message
+
diff --git a/tests/misc/uche.html b/tests/misc/uche.html
new file mode 100644
index 0000000..e6c725b
--- /dev/null
+++ b/tests/misc/uche.html
@@ -0,0 +1,10 @@
+
+<p><img src="http://fourthought.com/images/ftlogo.png" title="Fourthought logo" alt="asif"/>
+</p>
+<p>[<img src="http://fourthought.com/images/ftlogo.png" title="Fourthought logo" style="float: left; margin: 10px; border:
+none;" alt=""/>](http://fourthought.com/)
+</p>
+<p>[<img src="x" alt="text"/>](http://link.com/)
+</p>
+
+
diff --git a/tests/misc/uche.txt b/tests/misc/uche.txt
new file mode 100644
index 0000000..a3dda1a
--- /dev/null
+++ b/tests/misc/uche.txt
@@ -0,0 +1,7 @@
+![asif](http://fourthought.com/images/ftlogo.png "Fourthought logo")
+
+[![{@style=float: left; margin: 10px; border:
+none;}](http://fourthought.com/images/ftlogo.png "Fourthought
+logo")](http://fourthought.com/)
+
+[![text](x)](http://link.com/)
diff --git a/tests/misc/underscores.html b/tests/misc/underscores.html
new file mode 100644
index 0000000..14ccb02
--- /dev/null
+++ b/tests/misc/underscores.html
@@ -0,0 +1,15 @@
+
+<p>THIS_SHOULD_STAY_AS_IS
+</p>
+<p>Here is some <em>emphasis</em>, ok?
+</p>
+<p>Ok, at least <em>this</em> should work.
+</p>
+<p>THIS<strong>SHOULD</strong>STAY
+</p>
+<p>Here is some <strong>strong</strong> stuff.
+</p>
+<p>THIS<strong><em>SHOULD</em></strong>STAY?
+</p>
+
+
diff --git a/tests/misc/underscores.txt b/tests/misc/underscores.txt
new file mode 100644
index 0000000..3c7f4bd
--- /dev/null
+++ b/tests/misc/underscores.txt
@@ -0,0 +1,11 @@
+THIS_SHOULD_STAY_AS_IS
+
+Here is some _emphasis_, ok?
+
+Ok, at least _this_ should work.
+
+THIS__SHOULD__STAY
+
+Here is some __strong__ stuff.
+
+THIS___SHOULD___STAY?
diff --git a/tests/misc/url_spaces.html b/tests/misc/url_spaces.html
new file mode 100644
index 0000000..78c6521
--- /dev/null
+++ b/tests/misc/url_spaces.html
@@ -0,0 +1,7 @@
+
+<p><a href="http://wikipedia.org/wiki/Dawn of War">Dawn of War</a>
+</p>
+<p><a href="http://wikipedia.org/wiki/Dawn of War" title="Dawn of War">Dawn of War</a>
+</p>
+
+
diff --git a/tests/misc/url_spaces.txt b/tests/misc/url_spaces.txt
new file mode 100644
index 0000000..3d2a82d
--- /dev/null
+++ b/tests/misc/url_spaces.txt
@@ -0,0 +1,4 @@
+[Dawn of War](http://wikipedia.org/wiki/Dawn of War)
+
+
+[Dawn of War](http://wikipedia.org/wiki/Dawn of War "Dawn of War")
diff --git a/tests/misc/utfbom.html b/tests/misc/utfbom.html
new file mode 100644
index 0000000..a3ef50d
--- /dev/null
+++ b/tests/misc/utfbom.html
@@ -0,0 +1,7 @@
+
+
+<h1>A heading.</h1>
+<p>text text text text text text.
+</p>
+
+
diff --git a/tests/misc/utfbom.txt b/tests/misc/utfbom.txt
new file mode 100644
index 0000000..1c88258
--- /dev/null
+++ b/tests/misc/utfbom.txt
@@ -0,0 +1,4 @@
+A heading.
+==========
+
+text text text text text text. \ No newline at end of file