Hinzufügen von weiteren Kennzahlen in Spacy

pull/34/head
Zainab2604 2025-05-04 17:19:15 +02:00
parent 9c07ea8fad
commit 6dc510b524
15 changed files with 528 additions and 151 deletions

View File

@ -5,28 +5,8 @@
"page": 4 "page": 4
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "Laufzeit",
"entity": "5Mio.€", "entity": "10 bis 12 Jahre",
"page": 4
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "1,40 %",
"page": 4
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4,91 %",
"page": 4
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4,0 %",
"page": 4
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "0,1%",
"page": 4 "page": 4
}, },
{ {
@ -34,26 +14,6 @@
"entity": "4,0%", "entity": "4,0%",
"page": 5 "page": 5
}, },
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4 %",
"page": 9
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "800.000",
"page": 9
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "600.000",
"page": 9
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "400.000",
"page": 9
},
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "AUSSCHÜTTUNGSRENDITE",
"entity": "500.000 |", "entity": "500.000 |",
@ -61,12 +21,12 @@
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4", "entity": "5.20%",
"page": 9 "page": 11
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "Laufzeit",
"entity": "5.20%", "entity": "10-20",
"page": 11 "page": 11
}, },
{ {
@ -76,7 +36,7 @@
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4%", "entity": "45 %",
"page": 11 "page": 11
}, },
{ {
@ -90,68 +50,68 @@
"page": 12 "page": 12
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "Laufzeit",
"entity": "559 BGB", "entity": "15-45\n% verlorene",
"page": 16 "page": 12
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4 Soa",
"page": 16
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4 —",
"page": 16
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "558 BGB",
"page": 16
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "557 BGB",
"page": 16
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "3-6",
"page": 16
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "Vor NK-Optimlerung",
"page": 17
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "K.",
"page": 18
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4 an",
"page": 20
}, },
{ {
"label": "RISIKOPROFIL", "label": "RISIKOPROFIL",
"entity": "Value Adjustments", "entity": "Bein",
"page": 15
},
{
"label": "RISIKOPROFIL",
"entity": "Extt",
"page": 15
},
{
"label": "Risikoprofil",
"entity": "16",
"page": 16
},
{
"label": "Laufzeit",
"entity": "10-12 Jahre",
"page": 22
},
{
"label": "RISIKOPROFIL",
"entity": "CD",
"page": 25 "page": 25
}, },
{ {
"label": "RISIKOPROFIL", "label": "RISIKOPROFIL",
"entity": "Dach/", "entity": "CRD",
"page": 25
},
{
"label": "RISIKOPROFIL",
"entity": "CRR",
"page": 25
},
{
"label": "RISIKOPROFIL",
"entity": "CO2-neutrale",
"page": 28 "page": 28
}, },
{ {
"label": "RISIKOPROFIL", "label": "RISIKOPROFIL",
"entity": "CO2-Emissionen", "entity": "CO2-Emissionen",
"page": 28
},
{
"label": "RISIKOPROFIL",
"entity": "CO2-neutralen",
"page": 30 "page": 30
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "AUSSCHÜTTUNGSRENDITE",
"entity": "UM\\", "entity": "55 Standard",
"page": 30
},
{
"label": "RISIKOPROFIL",
"entity": "Ende",
"page": 30 "page": 30
}, },
{ {
@ -160,28 +120,53 @@
"page": 30 "page": 30
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "RISIKOPROFIL",
"entity": "5%", "entity": "Uber",
"page": 31 "page": 34
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "AUSSCHÜTTUNGSRENDITE",
"entity": "5%", "entity": "45%",
"page": 31
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "1%",
"page": 35 "page": 35
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "AUSSCHÜTTUNGSRENDITE",
"entity": "54%",
"page": 35
},
{
"label": "RISIKOPROFIL",
"entity": "£\nKlar definierte",
"page": 38
},
{
"label": "RISIKOPROFIL",
"entity": "Hand",
"page": 38
},
{
"label": "RISIKOPROFIL",
"entity": "CO2-Emissionen", "entity": "CO2-Emissionen",
"page": 38 "page": 38
}, },
{
"label": "RISIKOPROFIL",
"entity": "Ries",
"page": 39
},
{
"label": "RISIKOPROFIL",
"entity": "Rene Sondermann",
"page": 39
},
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "AUSSCHÜTTUNGSRENDITE",
"entity": "84,0%", "entity": "44%",
"page": 40
},
{
"label": "Laufzeit",
"entity": "10 - 12 Jahre",
"page": 42 "page": 42
}, },
{ {
@ -190,23 +175,8 @@
"page": 42 "page": 42
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "RISIKOPROFIL",
"entity": "0,1 %", "entity": "0,01%",
"page": 42
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "0,44 %",
"page": 42
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "1,40 %",
"page": 42
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "491%",
"page": 42 "page": 42
}, },
{ {
@ -220,13 +190,8 @@
"page": 44 "page": 44
}, },
{ {
"label": "AUSSCHÜTTUNGSRENDITE", "label": "Laufzeit",
"entity": "1,40%", "entity": "10 - 12 Jahre",
"page": 45 "page": 44
},
{
"label": "AUSSCHÜTTUNGSRENDITE",
"entity": "4,0%",
"page": 45
} }
] ]

View File

@ -2,13 +2,13 @@
"lang":"de", "lang":"de",
"name":"pipeline", "name":"pipeline",
"version":"0.0.0", "version":"0.0.0",
"spacy_version":">=3.7.2,<3.8.0", "spacy_version":">=3.8.5,<3.9.0",
"description":"", "description":"",
"author":"", "author":"",
"email":"", "email":"",
"url":"", "url":"",
"license":"", "license":"",
"spacy_git_version":"a89eae928", "spacy_git_version":"d0c705c",
"vectors":{ "vectors":{
"width":0, "width":0,
"vectors":0, "vectors":0,
@ -22,7 +22,10 @@
], ],
"ner":[ "ner":[
"AUSSCH\u00dcTTUNGSRENDITE", "AUSSCH\u00dcTTUNGSRENDITE",
"RISIKOPROFIL" "Aussch\u00fcttungsrendite",
"Laufzeit",
"RISIKOPROFIL",
"Risikoprofil"
] ]
}, },
"pipeline":[ "pipeline":[
@ -37,9 +40,9 @@
], ],
"performance":{ "performance":{
"ents_f":0.9107142857, "ents_f":0.9007633588,
"ents_p":0.8360655738, "ents_p":0.8309859155,
"ents_r":1.0, "ents_r":0.9833333333,
"ents_per_type":{ "ents_per_type":{
"RISIKOPROFIL":{ "RISIKOPROFIL":{
"p":1.0, "p":1.0,
@ -47,12 +50,27 @@
"f":1.0 "f":1.0
}, },
"AUSSCH\u00dcTTUNGSRENDITE":{ "AUSSCH\u00dcTTUNGSRENDITE":{
"p":0.6296296296, "p":0.5925925926,
"r":0.9411764706,
"f":0.7272727273
},
"Aussch\u00fcttungsrendite":{
"p":0.6666666667,
"r":1.0, "r":1.0,
"f":0.7727272727 "f":0.8
},
"Laufzeit":{
"p":1.0,
"r":1.0,
"f":1.0
},
"Risikoprofil":{
"p":1.0,
"r":1.0,
"f":1.0
} }
}, },
"tok2vec_loss":34.4831294568, "tok2vec_loss":128.6722957797,
"ner_loss":1020.9595334249 "ner_loss":1581.2761230469
} }
} }

View File

@ -1 +1 @@
¥movesÙô{"0":{},"1":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40},"2":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40},"3":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40},"4":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"":1},"5":{"":1}}£cfg<66>§neg_keyÀ ¥movesÚè{"0":{},"1":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"Laufzeit":21,"Aussch\u00fcttungsrendite":8,"Risikoprofil":5},"2":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"Laufzeit":21,"Aussch\u00fcttungsrendite":8,"Risikoprofil":5},"3":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"Laufzeit":21,"Aussch\u00fcttungsrendite":8,"Risikoprofil":5},"4":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"Laufzeit":21,"Aussch\u00fcttungsrendite":8,"Risikoprofil":5,"":1},"5":{"":1}}£cfg<66>§neg_keyÀ

View File

@ -52,7 +52,11 @@
"+", "+",
",", ",",
",00", ",00",
",12",
",25", ",25",
",40",
",80",
",91",
"-", "-",
"-((", "-((",
"-))", "-))",
@ -106,39 +110,55 @@
".w.", ".w.",
".\u00e4.", ".\u00e4.",
"/", "/",
"/2,12",
"/3", "/3",
"/Core+", "/Core+",
"/FK",
"/XX",
"/Xxxx+", "/Xxxx+",
"/core+", "/core+",
"/d", "/d",
"/d,dd",
"/fk",
"/xx",
"/xxxx+", "/xxxx+",
"0", "0",
"0%+", "0%+",
"0,1",
"0,80",
"0.0", "0.0",
"0.o", "0.o",
"000",
"018", "018",
"022", "022",
"023",
"032", "032",
"034", "034",
"0_0", "0_0",
"0_o", "0_o",
"1", "1",
"1,40",
"1.", "1.",
"10", "10",
"100",
"12", "12",
"14", "14",
"2", "2",
"2.", "2.",
"20", "20",
"200", "200",
"200.000",
"2018", "2018",
"2022", "2022",
"2032", "2032",
"2034", "2034",
"24",
"25",
"250", "250",
"3", "3",
"3,8", "3,8",
"3.", "3.",
"31.12.2023",
"33", "33",
"333", "333",
"35", "35",
@ -149,6 +169,7 @@
"4,7", "4,7",
"4,8", "4,8",
"4,9", "4,9",
"4,91",
"40", "40",
"5", "5",
"5,0", "5,0",
@ -157,11 +178,14 @@
"5,3", "5,3",
"5,7", "5,7",
"50", "50",
"5Mio.\u20ac",
"5mio.\u20ac",
"6", "6",
"60", "60",
"7", "7",
"7,5", "7,5",
"7,50%+", "7,50%+",
"75",
"8", "8",
"8)", "8)",
"8-", "8-",
@ -277,6 +301,7 @@
"A.G.", "A.G.",
"AIN", "AIN",
"AUSSCH\u00dcTTUNGSRENDITE", "AUSSCH\u00dcTTUNGSRENDITE",
"Ab",
"Abb", "Abb",
"Abb.", "Abb.",
"Abbildung", "Abbildung",
@ -294,13 +319,18 @@
"AlF", "AlF",
"Allgemeine", "Allgemeine",
"Amsterdam", "Amsterdam",
"Angestrebter",
"Ankauf",
"Ankaufs-", "Ankaufs-",
"Ankaufsphase",
"Anlagebedingungen", "Anlagebedingungen",
"Anlagestrategien", "Anlagestrategien",
"Anlagesusschuss", "Anlagesusschuss",
"Anlagevehikels", "Anlagevehikels",
"Annahmen",
"Ansprechpartners", "Ansprechpartners",
"Antagevehikels", "Antagevehikels",
"Anteilseigner",
"Apr", "Apr",
"Apr.", "Apr.",
"April", "April",
@ -309,6 +339,8 @@
"Artikel", "Artikel",
"Assets", "Assets",
"Aufl\u00f6sung", "Aufl\u00f6sung",
"Aufnahme",
"Auftakt",
"Aufwertung", "Aufwertung",
"Aug", "Aug",
"Aug.", "Aug.",
@ -319,6 +351,10 @@
"Ausschu\u0308ttungsintervalle", "Ausschu\u0308ttungsintervalle",
"Ausschu\u0308ttungsrandite", "Ausschu\u0308ttungsrandite",
"Ausschu\u0308ttungsrendite", "Ausschu\u0308ttungsrendite",
"Aussch\u00fcttungsintervalle",
"Aussch\u00fcttungsrandite",
"Aussch\u00fcttungsrendite",
"Aussch\u00fcttungsrendites",
"B", "B",
"B.", "B.",
"B.A.", "B.A.",
@ -371,6 +407,7 @@
"D", "D",
"D.", "D.",
"D.C.", "D.C.",
"Darlehen",
"Deutsche", "Deutsche",
"Deutschland", "Deutschland",
"Deutschlands", "Deutschlands",
@ -379,6 +416,7 @@
"Dezember", "Dezember",
"Di", "Di",
"Di.", "Di.",
"Die",
"Dienstag", "Dienstag",
"Different", "Different",
"Dipl", "Dipl",
@ -397,6 +435,9 @@
"E-Mail", "E-Mail",
"E.", "E.",
"ERD", "ERD",
"ESG-",
"EUR",
"Eigenkapital",
"Einmalige", "Einmalige",
"Einw", "Einw",
"Einwohner", "Einwohner",
@ -406,6 +447,7 @@
"Exit", "Exit",
"F", "F",
"F.", "F.",
"FDR",
"FIL", "FIL",
"FRANCE", "FRANCE",
"Fa", "Fa",
@ -416,6 +458,8 @@
"Feb", "Feb",
"Feb.", "Feb.",
"Februar", "Februar",
"Finanzierung",
"Finanzierungskonditionen",
"Firma", "Firma",
"Fond", "Fond",
"Fonds", "Fonds",
@ -424,6 +468,7 @@
"France", "France",
"Frankreich", "Frankreich",
"Frau", "Frau",
"Fremdkapital",
"French", "French",
"Frl", "Frl",
"Frl.", "Frl.",
@ -440,10 +485,12 @@
"Gebr", "Gebr",
"Gebr.", "Gebr.",
"Gebu\u0308hren", "Gebu\u0308hren",
"Geb\u00fchren",
"Geplantes", "Geplantes",
"Gesamtrendite", "Gesamtrendite",
"H", "H",
"H.", "H.",
"Haltedauer",
"Halten", "Halten",
"Halten-Strategie", "Halten-Strategie",
"Hauptbahnhof", "Hauptbahnhof",
@ -482,7 +529,12 @@
"Informationen", "Informationen",
"Ing", "Ing",
"Ing.", "Ing.",
"Invastitionsfokus",
"Investftionsvolumen",
"Investitionen",
"Investitions-annahmen",
"Investmentmanagers", "Investmentmanagers",
"Investmentzeitraum",
"Investtionszeltraum", "Investtionszeltraum",
"It", "It",
"J", "J",
@ -507,8 +559,11 @@
"K", "K",
"K.", "K.",
"K.O.", "K.O.",
"Kapitalzusagen",
"Kaufen", "Kaufen",
"Keine",
"Key", "Key",
"Klassifizierung",
"Kosten", "Kosten",
"L", "L",
"L'", "L'",
@ -543,12 +598,14 @@
"Milliarde", "Milliarde",
"Million", "Million",
"Mindestanlage", "Mindestanlage",
"Mindestens",
"Mio", "Mio",
"Mio.", "Mio.",
"Mitgliedschaft", "Mitgliedschaft",
"Mittwoch", "Mittwoch",
"Mo", "Mo",
"Mo.", "Mo.",
"Monate",
"Montag", "Montag",
"Mr", "Mr",
"Mr.", "Mr.",
@ -586,6 +643,8 @@
"OPCI", "OPCI",
"O_O", "O_O",
"O_o", "O_o",
"Objekt",
"Objekten",
"Of", "Of",
"Offen", "Offen",
"Offener", "Offener",
@ -610,7 +669,9 @@
"Professor", "Professor",
"Prognostizierte", "Prognostizierte",
"Punkt", "Punkt",
"Q",
"Qin", "Qin",
"Quote",
"R", "R",
"R.", "R.",
"R.I.P.", "R.I.P.",
@ -625,6 +686,8 @@
"Red.", "Red.",
"Redaktion", "Redaktion",
"Regionen", "Regionen",
"Rendite-",
"Renovierungen",
"Rents", "Rents",
"Residential", "Residential",
"Retail", "Retail",
@ -633,6 +696,8 @@
"Rotterdam", "Rotterdam",
"S", "S",
"S'", "S'",
"SFDR",
"SG-",
"SPAIN", "SPAIN",
"SRI", "SRI",
"Sa", "Sa",
@ -654,6 +719,7 @@
"Spezial-AlF", "Spezial-AlF",
"St", "St",
"St.", "St.",
"Stabilisierung",
"Standortaufwertungsstrategie", "Standortaufwertungsstrategie",
"Standorte", "Standorte",
"Std", "Std",
@ -666,11 +732,13 @@
"Stra\u00dfe", "Stra\u00dfe",
"Struktur", "Struktur",
"Strukturierungsgebu\u0308hr", "Strukturierungsgebu\u0308hr",
"Strukturierungsgeb\u00fchr",
"Stunde", "Stunde",
"St\u00e4dten", "St\u00e4dten",
"S\u2019", "S\u2019",
"T", "T",
"T.", "T.",
"Tag",
"Tausend", "Tausend",
"Teflimmobilfe)-", "Teflimmobilfe)-",
"Tel", "Tel",
@ -698,7 +766,9 @@
"V.V", "V.V",
"V_V", "V_V",
"Value", "Value",
"Verbesserungen",
"Vergu\u0308tung", "Vergu\u0308tung",
"Verg\u00fctung",
"Verkaufs", "Verkaufs",
"Verkaufs-", "Verkaufs-",
"Vol", "Vol",
@ -724,6 +794,7 @@
"XX", "XX",
"XX.", "XX.",
"XXX", "XXX",
"XXX-",
"XXX.", "XXX.",
"XXX/XXX", "XXX/XXX",
"XXXX", "XXXX",
@ -742,6 +813,7 @@
"Xxxx", "Xxxx",
"Xxxx+", "Xxxx+",
"Xxxx+/Xxxxx", "Xxxx+/Xxxxx",
"Xxxx-",
"Xxxx-XXX", "Xxxx-XXX",
"Xxxx-Xxxxx-XXX", "Xxxx-Xxxxx-XXX",
"Xxxx.", "Xxxx.",
@ -753,6 +825,7 @@
"Xxxxx-", "Xxxxx-",
"Xxxxx-XxX", "Xxxxx-XxX",
"Xxxxx-Xxxxx", "Xxxxx-Xxxxx",
"Xxxxx-xxxx",
"Xxxxx\u0308xx", "Xxxxx\u0308xx",
"Xxxxx\u0308xxxx", "Xxxxx\u0308xxxx",
"Xxxx\u0308xxxx", "Xxxx\u0308xxxx",
@ -763,11 +836,15 @@
"Ziel-LTY", "Ziel-LTY",
"Ziel-Netto-IRR", "Ziel-Netto-IRR",
"Zielanlagestrategie", "Zielanlagestrategie",
"Zielm\u00e4rkte",
"Zielobjektgr\u00f6\u00dfe",
"Zielregionfen)/Jand", "Zielregionfen)/Jand",
"Zielrendite", "Zielrendite",
"Zielsektoren", "Zielsektoren",
"Zielvolumen", "Zielvolumen",
"Ziirraiaein", "Ziirraiaein",
"Zins-",
"Zinss\u00e4tze",
"Zt", "Zt",
"Zt.", "Zt.",
"[", "[",
@ -806,6 +883,7 @@
"a.g.", "a.g.",
"a.m.", "a.m.",
"a.z.", "a.z.",
"ab",
"abb", "abb",
"abb.", "abb.",
"abk", "abk",
@ -832,10 +910,12 @@
"aiming", "aiming",
"ain", "ain",
"ake", "ake",
"akt",
"aktive", "aktive",
"aktueller", "aktueller",
"al", "al",
"al.", "al.",
"ald",
"alf", "alf",
"all", "all",
"allg", "allg",
@ -849,15 +929,21 @@
"an", "an",
"an.", "an.",
"and", "and",
"angestrebt",
"angestrebter",
"ankauf",
"ankaufs-", "ankaufs-",
"ankaufsphase",
"anlagebedingungen", "anlagebedingungen",
"anlagestrategien", "anlagestrategien",
"anlagesusschuss", "anlagesusschuss",
"anlagevehikels", "anlagevehikels",
"annahmen",
"ans", "ans",
"ansprechpartners", "ansprechpartners",
"ant", "ant",
"antagevehikels", "antagevehikels",
"anteilseigner",
"apr", "apr",
"apr.", "apr.",
"are", "are",
@ -867,6 +953,7 @@
"art", "art",
"artikel", "artikel",
"as", "as",
"ase",
"asset", "asset",
"assetor", "assetor",
"assets", "assets",
@ -877,6 +964,8 @@
"attractive", "attractive",
"auf", "auf",
"aufl\u00f6sung", "aufl\u00f6sung",
"aufnahme",
"auftakt",
"aufwertung", "aufwertung",
"auf\u2019m", "auf\u2019m",
"aug", "aug",
@ -885,11 +974,15 @@
"auschittungsrendite", "auschittungsrendite",
"auschu\u0308ttungsrendite", "auschu\u0308ttungsrendite",
"ausgew\u00e4hlte", "ausgew\u00e4hlte",
"ausschlie\u00dflich",
"ausschu\u0308ttung", "ausschu\u0308ttung",
"ausschu\u0308ttungsintervalle", "ausschu\u0308ttungsintervalle",
"ausschu\u0308ttungsrandite", "ausschu\u0308ttungsrandite",
"ausschu\u0308ttungsrendite", "ausschu\u0308ttungsrendite",
"aussch\u00fcttungsintervalle",
"aussch\u00fcttungsrandite",
"aussch\u00fcttungsrendite", "aussch\u00fcttungsrendite",
"aussch\u00fcttungsrendites",
"ave", "ave",
"ax.", "ax.",
"b", "b",
@ -904,6 +997,7 @@
"bd", "bd",
"bd.", "bd.",
"be", "be",
"bei",
"beispielsweise", "beispielsweise",
"belgium", "belgium",
"benefits", "benefits",
@ -921,6 +1015,7 @@
"bhf.", "bhf.",
"biol", "biol",
"biol.", "biol.",
"bis",
"bk.", "bk.",
"bon", "bon",
"br.", "br.",
@ -999,11 +1094,15 @@
"d.h.", "d.h.",
"d.x", "d.x",
"dX", "dX",
"dXxx.\u20ac",
"d_d", "d_d",
"d_x", "d_x",
"dam", "dam",
"darlehen",
"dd", "dd",
"dd.dd.dddd",
"ddd", "ddd",
"ddd.ddd",
"dddd", "dddd",
"de", "de",
"ded", "ded",
@ -1024,6 +1123,7 @@
"dgl.", "dgl.",
"di", "di",
"di.", "di.",
"die",
"different", "different",
"dipl", "dipl",
"dipl.", "dipl.",
@ -1042,6 +1142,7 @@
"du", "du",
"du\u2019s", "du\u2019s",
"dv.", "dv.",
"dxxx.\u20ac",
"d\u00e4nemark", "d\u00e4nemark",
"d\u2019", "d\u2019",
"e", "e",
@ -1060,13 +1161,16 @@
"ebd.", "ebd.",
"ebenda", "ebenda",
"ebr", "ebr",
"ebt",
"economic", "economic",
"ed.", "ed.",
"eep", "eep",
"egr", "egr",
"egt",
"egy", "egy",
"ehem", "ehem",
"ehem.", "ehem.",
"eigenkapital",
"eigentlich", "eigentlich",
"eigtl", "eigtl",
"eigtl.", "eigtl.",
@ -1076,11 +1180,15 @@
"einen", "einen",
"einer", "einer",
"einmalige", "einmalige",
"eins",
"einw", "einw",
"einwohner", "einwohner",
"einzeln",
"eit", "eit",
"ekt",
"el.", "el.",
"eld", "eld",
"eln",
"els", "els",
"em.", "em.",
"en.", "en.",
@ -1090,6 +1198,7 @@
"engl.", "engl.",
"englisch", "englisch",
"enhancing", "enhancing",
"ens",
"ent", "ent",
"entspr", "entspr",
"entspr.", "entspr.",
@ -1100,6 +1209,7 @@
"er.", "er.",
"erd", "erd",
"ere", "ere",
"erfolgten",
"erg", "erg",
"erm", "erm",
"erm.", "erm.",
@ -1110,12 +1220,14 @@
"ery", "ery",
"er\u2019s", "er\u2019s",
"es", "es",
"esg-",
"ess", "ess",
"estate", "estate",
"etc", "etc",
"etc.", "etc.",
"etr", "etr",
"ets", "ets",
"eur",
"europe", "europe",
"european", "european",
"ev", "ev",
@ -1127,6 +1239,7 @@
"experienced", "experienced",
"expertise", "expertise",
"exposure", "exposure",
"externe",
"extract", "extract",
"ez.", "ez.",
"e\u2019s", "e\u2019s",
@ -1136,13 +1249,17 @@
"fa.", "fa.",
"fam", "fam",
"fam.", "fam.",
"fdr",
"feb", "feb",
"feb.", "feb.",
"fen", "fen",
"festen", "festen",
"festgelegt",
"festgelegter", "festgelegter",
"fierce", "fierce",
"fil", "fil",
"finanzierung",
"finanzierungskonditionen",
"flagship", "flagship",
"fond", "fond",
"fonds", "fonds",
@ -1153,6 +1270,7 @@
"france", "france",
"frankreich", "frankreich",
"franz\u00f6sisch", "franz\u00f6sisch",
"fremdkapital",
"french", "french",
"frl", "frl",
"frl.", "frl.",
@ -1162,6 +1280,7 @@
"fs.", "fs.",
"fund", "fund",
"fu\u0308hrende", "fu\u0308hrende",
"f\u00fcr",
"f\u2019m", "f\u2019m",
"g", "g",
"g.", "g.",
@ -1173,6 +1292,7 @@
"gebr", "gebr",
"gebr.", "gebr.",
"gebu\u0308hren", "gebu\u0308hren",
"geb\u00fchren",
"ged", "ged",
"gedis", "gedis",
"gegebenenfalls", "gegebenenfalls",
@ -1185,6 +1305,7 @@
"gen", "gen",
"geographies", "geographies",
"geplantes", "geplantes",
"gepr\u00fcft",
"ger", "ger",
"gerd", "gerd",
"gesamtrendite", "gesamtrendite",
@ -1209,6 +1330,7 @@
"h.", "h.",
"h.c", "h.c",
"h.c.", "h.c.",
"haltedauer",
"halten", "halten",
"halten-strategie", "halten-strategie",
"have", "have",
@ -1217,6 +1339,7 @@
"hd.", "hd.",
"hed", "hed",
"hem", "hem",
"hen",
"here", "here",
"hf.", "hf.",
"hg", "hg",
@ -1227,6 +1350,7 @@
"hinter\u2019m", "hinter\u2019m",
"hip", "hip",
"his", "his",
"hme",
"hotel", "hotel",
"hotels", "hotels",
"hr", "hr",
@ -1303,9 +1427,14 @@
"insb.", "insb.",
"insbesondere", "insbesondere",
"interesting", "interesting",
"invastitionsfokus",
"investftionsvolumen",
"investitionen",
"investitions-annahmen",
"investment", "investment",
"investmentmanagers", "investmentmanagers",
"investments", "investments",
"investmentzeitraum",
"investor", "investor",
"investtionszeltraum", "investtionszeltraum",
"inw", "inw",
@ -1313,6 +1442,7 @@
"iol", "iol",
"ion", "ion",
"ipl", "ipl",
"ird",
"irr", "irr",
"is", "is",
"ise", "ise",
@ -1334,6 +1464,7 @@
"jahre", "jahre",
"jan", "jan",
"jan.", "jan.",
"jedes",
"jh", "jh",
"jh.", "jh.",
"jhd", "jhd",
@ -1346,20 +1477,26 @@
"jun.", "jun.",
"jur", "jur",
"jur.", "jur.",
"j\u00e4hrlich",
"j\u00e4hrliche", "j\u00e4hrliche",
"k", "k",
"k.", "k.",
"k.o.", "k.o.",
"kapitalzusagen",
"kath", "kath",
"kath.", "kath.",
"katholisch", "katholisch",
"kaufen", "kaufen",
"keine",
"kel", "kel",
"ket", "ket",
"key", "key",
"kl.", "kl.",
"klassifizierung",
"kosten", "kosten",
"kt.", "kt.",
"kte",
"kus",
"l", "l",
"l'", "l'",
"l.", "l.",
@ -1452,6 +1589,7 @@
"mitgliedschaft", "mitgliedschaft",
"mo", "mo",
"mo.", "mo.",
"monate",
"monatlich", "monatlich",
"mr", "mr",
"mr.", "mr.",
@ -1474,6 +1612,7 @@
"n.y.", "n.y.",
"n.y.c.", "n.y.c.",
"nach", "nach",
"nachhaltig",
"nachvermietungsstrategie", "nachvermietungsstrategie",
"name", "name",
"nat", "nat",
@ -1493,6 +1632,7 @@
"ner", "ner",
"nes", "nes",
"netherlands", "netherlands",
"neu",
"ng.", "ng.",
"ngl", "ngl",
"ngs", "ngs",
@ -1505,6 +1645,7 @@
"nov.", "nov.",
"nr", "nr",
"nr.", "nr.",
"ns-",
"nsb", "nsb",
"nse", "nse",
"nts", "nts",
@ -1522,10 +1663,13 @@
"o.o", "o.o",
"o.\u00e4", "o.\u00e4",
"o.\u00e4.", "o.\u00e4.",
"o.\u20ac",
"o_0", "o_0",
"o_O", "o_O",
"o_o", "o_o",
"objectives", "objectives",
"objekt",
"objekten",
"of", "of",
"of.", "of.",
"ofQin", "ofQin",
@ -1561,6 +1705,7 @@
"original", "original",
"orm", "orm",
"ors", "ors",
"ote",
"outside", "outside",
"ov.", "ov.",
"ove", "ove",
@ -1609,6 +1754,7 @@
"q.e.d.", "q.e.d.",
"qin", "qin",
"quality", "quality",
"quote",
"r", "r",
"r.", "r.",
"r.i.p.", "r.i.p.",
@ -1630,6 +1776,8 @@
"regionen", "regionen",
"remains", "remains",
"ren", "ren",
"rendite-",
"renovierungen",
"rent", "rent",
"rents", "rents",
"rer", "rer",
@ -1649,6 +1797,7 @@
"rm.", "rm.",
"rms", "rms",
"rn.", "rn.",
"rne",
"rof", "rof",
"room", "room",
"rotterdam", "rotterdam",
@ -1687,7 +1836,10 @@
"sept.", "sept.",
"set", "set",
"sf.", "sf.",
"sfdr",
"sg-",
"sg.", "sg.",
"sich",
"sie", "sie",
"sie\u2019s", "sie\u2019s",
"sis", "sis",
@ -1696,6 +1848,7 @@
"small", "small",
"so", "so",
"so.", "so.",
"sobald",
"sog", "sog",
"sog.", "sog.",
"some", "some",
@ -1709,6 +1862,8 @@
"ss.", "ss.",
"st", "st",
"st.", "st.",
"stabilisieren",
"stabilisierung",
"standortaufwertungsstrategie", "standortaufwertungsstrategie",
"standorte", "standorte",
"std", "std",
@ -1724,17 +1879,20 @@
"strategy", "strategy",
"struktur", "struktur",
"strukturierungsgebu\u0308hr", "strukturierungsgebu\u0308hr",
"strukturierungsgeb\u00fchr",
"st\u00e4dten", "st\u00e4dten",
"sw.", "sw.",
"s\u2019", "s\u2019",
"t", "t",
"t.", "t.",
"tactical", "tactical",
"tag",
"tal", "tal",
"targeting", "targeting",
"targets", "targets",
"tc.", "tc.",
"td.", "td.",
"te-",
"ted", "ted",
"tee", "tee",
"teflimmobilfe)-", "teflimmobilfe)-",
@ -1765,6 +1923,7 @@
"tsd", "tsd",
"tsd.", "tsd.",
"tur", "tur",
"tze",
"t\u00e4gl", "t\u00e4gl",
"t\u00e4gl.", "t\u00e4gl.",
"t\u00e4glich", "t\u00e4glich",
@ -1781,6 +1940,7 @@
"u.u.", "u.u.",
"u.v.m", "u.v.m",
"u.v.m.", "u.v.m.",
"uer",
"ufs", "ufs",
"ug.", "ug.",
"ugh", "ugh",
@ -1797,6 +1957,7 @@
"univ.", "univ.",
"unless", "unless",
"unter", "unter",
"unterstellt",
"unter\u2019m", "unter\u2019m",
"ur.", "ur.",
"ure", "ure",
@ -1826,8 +1987,10 @@
"var", "var",
"vel", "vel",
"ver", "ver",
"verbesserungen",
"vergleiche", "vergleiche",
"vergu\u0308tung", "vergu\u0308tung",
"verg\u00fctung",
"verkaufs", "verkaufs",
"verkaufs-", "verkaufs-",
"very", "very",
@ -1855,9 +2018,11 @@
"walls", "walls",
"way", "way",
"well-established", "well-established",
"werden",
"wertstabile", "wertstabile",
"why", "why",
"wir", "wir",
"wird",
"wir\u2019s", "wir\u2019s",
"wiss", "wiss",
"wiss.", "wiss.",
@ -1895,6 +2060,7 @@
"xx.x", "xx.x",
"xxXxx", "xxXxx",
"xxx", "xxx",
"xxx-",
"xxx-Xxxxx", "xxx-Xxxxx",
"xxx-xxxx", "xxx-xxxx",
"xxx.", "xxx.",
@ -1938,13 +2104,20 @@
"ziel-lty", "ziel-lty",
"ziel-netto-irr", "ziel-netto-irr",
"zielanlagestrategie", "zielanlagestrategie",
"zielm\u00e4rkte",
"zielobjektgr\u00f6\u00dfe",
"zielregionfen)/jand", "zielregionfen)/jand",
"zielrendite", "zielrendite",
"zielsektoren", "zielsektoren",
"zielvolumen", "zielvolumen",
"ziirraiaein", "ziirraiaein",
"zins-",
"zinss\u00e4tze",
"zt", "zt",
"zu",
"zum",
"zw.", "zw.",
"zwischen",
"zzgl", "zzgl",
"zzgl.", "zzgl.",
"{", "{",
@ -1977,11 +2150,14 @@
"\u00f6sterr", "\u00f6sterr",
"\u00f6sterr.", "\u00f6sterr.",
"\u00f6sterreichisch", "\u00f6sterreichisch",
"\u00f6\u00dfe",
"\u00fc", "\u00fc",
"\u00fc.", "\u00fc.",
"\u00fcber", "\u00fcber",
"\u00fcbersicht", "\u00fcbersicht",
"\u00fcber\u2019m", "\u00fcber\u2019m",
"\u00fcft",
"\u00fchr",
"\u0308hr", "\u0308hr",
"\u0ca0", "\u0ca0",
"\u0ca0_\u0ca0", "\u0ca0_\u0ca0",

View File

@ -2,13 +2,13 @@
"lang":"de", "lang":"de",
"name":"pipeline", "name":"pipeline",
"version":"0.0.0", "version":"0.0.0",
"spacy_version":">=3.7.2,<3.8.0", "spacy_version":">=3.8.5,<3.9.0",
"description":"", "description":"",
"author":"", "author":"",
"email":"", "email":"",
"url":"", "url":"",
"license":"", "license":"",
"spacy_git_version":"a89eae928", "spacy_git_version":"d0c705c",
"vectors":{ "vectors":{
"width":0, "width":0,
"vectors":0, "vectors":0,
@ -22,7 +22,10 @@
], ],
"ner":[ "ner":[
"AUSSCH\u00dcTTUNGSRENDITE", "AUSSCH\u00dcTTUNGSRENDITE",
"RISIKOPROFIL" "Aussch\u00fcttungsrendite",
"Laufzeit",
"RISIKOPROFIL",
"Risikoprofil"
] ]
}, },
"pipeline":[ "pipeline":[
@ -37,9 +40,9 @@
], ],
"performance":{ "performance":{
"ents_f":0.9107142857, "ents_f":0.9007633588,
"ents_p":0.8360655738, "ents_p":0.8309859155,
"ents_r":1.0, "ents_r":0.9833333333,
"ents_per_type":{ "ents_per_type":{
"RISIKOPROFIL":{ "RISIKOPROFIL":{
"p":1.0, "p":1.0,
@ -47,12 +50,27 @@
"f":1.0 "f":1.0
}, },
"AUSSCH\u00dcTTUNGSRENDITE":{ "AUSSCH\u00dcTTUNGSRENDITE":{
"p":0.6296296296, "p":0.5925925926,
"r":0.9411764706,
"f":0.7272727273
},
"Aussch\u00fcttungsrendite":{
"p":0.6666666667,
"r":1.0, "r":1.0,
"f":0.7727272727 "f":0.8
},
"Laufzeit":{
"p":1.0,
"r":1.0,
"f":1.0
},
"Risikoprofil":{
"p":1.0,
"r":1.0,
"f":1.0
} }
}, },
"tok2vec_loss":34.4831294568, "tok2vec_loss":128.6722957797,
"ner_loss":1020.9595334249 "ner_loss":1581.2761230469
} }
} }

View File

@ -1 +1 @@
¥movesÙô{"0":{},"1":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40},"2":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40},"3":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40},"4":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"":1},"5":{"":1}}£cfg<66>§neg_keyÀ ¥movesÚè{"0":{},"1":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"Laufzeit":21,"Aussch\u00fcttungsrendite":8,"Risikoprofil":5},"2":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"Laufzeit":21,"Aussch\u00fcttungsrendite":8,"Risikoprofil":5},"3":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"Laufzeit":21,"Aussch\u00fcttungsrendite":8,"Risikoprofil":5},"4":{"RISIKOPROFIL":91,"AUSSCH\u00dcTTUNGSRENDITE":40,"Laufzeit":21,"Aussch\u00fcttungsrendite":8,"Risikoprofil":5,"":1},"5":{"":1}}£cfg<66>§neg_keyÀ

View File

@ -52,7 +52,11 @@
"+", "+",
",", ",",
",00", ",00",
",12",
",25", ",25",
",40",
",80",
",91",
"-", "-",
"-((", "-((",
"-))", "-))",
@ -106,39 +110,55 @@
".w.", ".w.",
".\u00e4.", ".\u00e4.",
"/", "/",
"/2,12",
"/3", "/3",
"/Core+", "/Core+",
"/FK",
"/XX",
"/Xxxx+", "/Xxxx+",
"/core+", "/core+",
"/d", "/d",
"/d,dd",
"/fk",
"/xx",
"/xxxx+", "/xxxx+",
"0", "0",
"0%+", "0%+",
"0,1",
"0,80",
"0.0", "0.0",
"0.o", "0.o",
"000",
"018", "018",
"022", "022",
"023",
"032", "032",
"034", "034",
"0_0", "0_0",
"0_o", "0_o",
"1", "1",
"1,40",
"1.", "1.",
"10", "10",
"100",
"12", "12",
"14", "14",
"2", "2",
"2.", "2.",
"20", "20",
"200", "200",
"200.000",
"2018", "2018",
"2022", "2022",
"2032", "2032",
"2034", "2034",
"24",
"25",
"250", "250",
"3", "3",
"3,8", "3,8",
"3.", "3.",
"31.12.2023",
"33", "33",
"333", "333",
"35", "35",
@ -149,6 +169,7 @@
"4,7", "4,7",
"4,8", "4,8",
"4,9", "4,9",
"4,91",
"40", "40",
"5", "5",
"5,0", "5,0",
@ -157,11 +178,14 @@
"5,3", "5,3",
"5,7", "5,7",
"50", "50",
"5Mio.\u20ac",
"5mio.\u20ac",
"6", "6",
"60", "60",
"7", "7",
"7,5", "7,5",
"7,50%+", "7,50%+",
"75",
"8", "8",
"8)", "8)",
"8-", "8-",
@ -277,6 +301,7 @@
"A.G.", "A.G.",
"AIN", "AIN",
"AUSSCH\u00dcTTUNGSRENDITE", "AUSSCH\u00dcTTUNGSRENDITE",
"Ab",
"Abb", "Abb",
"Abb.", "Abb.",
"Abbildung", "Abbildung",
@ -294,13 +319,18 @@
"AlF", "AlF",
"Allgemeine", "Allgemeine",
"Amsterdam", "Amsterdam",
"Angestrebter",
"Ankauf",
"Ankaufs-", "Ankaufs-",
"Ankaufsphase",
"Anlagebedingungen", "Anlagebedingungen",
"Anlagestrategien", "Anlagestrategien",
"Anlagesusschuss", "Anlagesusschuss",
"Anlagevehikels", "Anlagevehikels",
"Annahmen",
"Ansprechpartners", "Ansprechpartners",
"Antagevehikels", "Antagevehikels",
"Anteilseigner",
"Apr", "Apr",
"Apr.", "Apr.",
"April", "April",
@ -309,6 +339,8 @@
"Artikel", "Artikel",
"Assets", "Assets",
"Aufl\u00f6sung", "Aufl\u00f6sung",
"Aufnahme",
"Auftakt",
"Aufwertung", "Aufwertung",
"Aug", "Aug",
"Aug.", "Aug.",
@ -319,6 +351,10 @@
"Ausschu\u0308ttungsintervalle", "Ausschu\u0308ttungsintervalle",
"Ausschu\u0308ttungsrandite", "Ausschu\u0308ttungsrandite",
"Ausschu\u0308ttungsrendite", "Ausschu\u0308ttungsrendite",
"Aussch\u00fcttungsintervalle",
"Aussch\u00fcttungsrandite",
"Aussch\u00fcttungsrendite",
"Aussch\u00fcttungsrendites",
"B", "B",
"B.", "B.",
"B.A.", "B.A.",
@ -371,6 +407,7 @@
"D", "D",
"D.", "D.",
"D.C.", "D.C.",
"Darlehen",
"Deutsche", "Deutsche",
"Deutschland", "Deutschland",
"Deutschlands", "Deutschlands",
@ -379,6 +416,7 @@
"Dezember", "Dezember",
"Di", "Di",
"Di.", "Di.",
"Die",
"Dienstag", "Dienstag",
"Different", "Different",
"Dipl", "Dipl",
@ -397,6 +435,9 @@
"E-Mail", "E-Mail",
"E.", "E.",
"ERD", "ERD",
"ESG-",
"EUR",
"Eigenkapital",
"Einmalige", "Einmalige",
"Einw", "Einw",
"Einwohner", "Einwohner",
@ -406,6 +447,7 @@
"Exit", "Exit",
"F", "F",
"F.", "F.",
"FDR",
"FIL", "FIL",
"FRANCE", "FRANCE",
"Fa", "Fa",
@ -416,6 +458,8 @@
"Feb", "Feb",
"Feb.", "Feb.",
"Februar", "Februar",
"Finanzierung",
"Finanzierungskonditionen",
"Firma", "Firma",
"Fond", "Fond",
"Fonds", "Fonds",
@ -424,6 +468,7 @@
"France", "France",
"Frankreich", "Frankreich",
"Frau", "Frau",
"Fremdkapital",
"French", "French",
"Frl", "Frl",
"Frl.", "Frl.",
@ -440,10 +485,12 @@
"Gebr", "Gebr",
"Gebr.", "Gebr.",
"Gebu\u0308hren", "Gebu\u0308hren",
"Geb\u00fchren",
"Geplantes", "Geplantes",
"Gesamtrendite", "Gesamtrendite",
"H", "H",
"H.", "H.",
"Haltedauer",
"Halten", "Halten",
"Halten-Strategie", "Halten-Strategie",
"Hauptbahnhof", "Hauptbahnhof",
@ -482,7 +529,12 @@
"Informationen", "Informationen",
"Ing", "Ing",
"Ing.", "Ing.",
"Invastitionsfokus",
"Investftionsvolumen",
"Investitionen",
"Investitions-annahmen",
"Investmentmanagers", "Investmentmanagers",
"Investmentzeitraum",
"Investtionszeltraum", "Investtionszeltraum",
"It", "It",
"J", "J",
@ -507,8 +559,11 @@
"K", "K",
"K.", "K.",
"K.O.", "K.O.",
"Kapitalzusagen",
"Kaufen", "Kaufen",
"Keine",
"Key", "Key",
"Klassifizierung",
"Kosten", "Kosten",
"L", "L",
"L'", "L'",
@ -543,12 +598,14 @@
"Milliarde", "Milliarde",
"Million", "Million",
"Mindestanlage", "Mindestanlage",
"Mindestens",
"Mio", "Mio",
"Mio.", "Mio.",
"Mitgliedschaft", "Mitgliedschaft",
"Mittwoch", "Mittwoch",
"Mo", "Mo",
"Mo.", "Mo.",
"Monate",
"Montag", "Montag",
"Mr", "Mr",
"Mr.", "Mr.",
@ -586,6 +643,8 @@
"OPCI", "OPCI",
"O_O", "O_O",
"O_o", "O_o",
"Objekt",
"Objekten",
"Of", "Of",
"Offen", "Offen",
"Offener", "Offener",
@ -610,7 +669,9 @@
"Professor", "Professor",
"Prognostizierte", "Prognostizierte",
"Punkt", "Punkt",
"Q",
"Qin", "Qin",
"Quote",
"R", "R",
"R.", "R.",
"R.I.P.", "R.I.P.",
@ -625,6 +686,8 @@
"Red.", "Red.",
"Redaktion", "Redaktion",
"Regionen", "Regionen",
"Rendite-",
"Renovierungen",
"Rents", "Rents",
"Residential", "Residential",
"Retail", "Retail",
@ -633,6 +696,8 @@
"Rotterdam", "Rotterdam",
"S", "S",
"S'", "S'",
"SFDR",
"SG-",
"SPAIN", "SPAIN",
"SRI", "SRI",
"Sa", "Sa",
@ -654,6 +719,7 @@
"Spezial-AlF", "Spezial-AlF",
"St", "St",
"St.", "St.",
"Stabilisierung",
"Standortaufwertungsstrategie", "Standortaufwertungsstrategie",
"Standorte", "Standorte",
"Std", "Std",
@ -666,11 +732,13 @@
"Stra\u00dfe", "Stra\u00dfe",
"Struktur", "Struktur",
"Strukturierungsgebu\u0308hr", "Strukturierungsgebu\u0308hr",
"Strukturierungsgeb\u00fchr",
"Stunde", "Stunde",
"St\u00e4dten", "St\u00e4dten",
"S\u2019", "S\u2019",
"T", "T",
"T.", "T.",
"Tag",
"Tausend", "Tausend",
"Teflimmobilfe)-", "Teflimmobilfe)-",
"Tel", "Tel",
@ -698,7 +766,9 @@
"V.V", "V.V",
"V_V", "V_V",
"Value", "Value",
"Verbesserungen",
"Vergu\u0308tung", "Vergu\u0308tung",
"Verg\u00fctung",
"Verkaufs", "Verkaufs",
"Verkaufs-", "Verkaufs-",
"Vol", "Vol",
@ -724,6 +794,7 @@
"XX", "XX",
"XX.", "XX.",
"XXX", "XXX",
"XXX-",
"XXX.", "XXX.",
"XXX/XXX", "XXX/XXX",
"XXXX", "XXXX",
@ -742,6 +813,7 @@
"Xxxx", "Xxxx",
"Xxxx+", "Xxxx+",
"Xxxx+/Xxxxx", "Xxxx+/Xxxxx",
"Xxxx-",
"Xxxx-XXX", "Xxxx-XXX",
"Xxxx-Xxxxx-XXX", "Xxxx-Xxxxx-XXX",
"Xxxx.", "Xxxx.",
@ -753,6 +825,7 @@
"Xxxxx-", "Xxxxx-",
"Xxxxx-XxX", "Xxxxx-XxX",
"Xxxxx-Xxxxx", "Xxxxx-Xxxxx",
"Xxxxx-xxxx",
"Xxxxx\u0308xx", "Xxxxx\u0308xx",
"Xxxxx\u0308xxxx", "Xxxxx\u0308xxxx",
"Xxxx\u0308xxxx", "Xxxx\u0308xxxx",
@ -763,11 +836,15 @@
"Ziel-LTY", "Ziel-LTY",
"Ziel-Netto-IRR", "Ziel-Netto-IRR",
"Zielanlagestrategie", "Zielanlagestrategie",
"Zielm\u00e4rkte",
"Zielobjektgr\u00f6\u00dfe",
"Zielregionfen)/Jand", "Zielregionfen)/Jand",
"Zielrendite", "Zielrendite",
"Zielsektoren", "Zielsektoren",
"Zielvolumen", "Zielvolumen",
"Ziirraiaein", "Ziirraiaein",
"Zins-",
"Zinss\u00e4tze",
"Zt", "Zt",
"Zt.", "Zt.",
"[", "[",
@ -806,6 +883,7 @@
"a.g.", "a.g.",
"a.m.", "a.m.",
"a.z.", "a.z.",
"ab",
"abb", "abb",
"abb.", "abb.",
"abk", "abk",
@ -832,10 +910,12 @@
"aiming", "aiming",
"ain", "ain",
"ake", "ake",
"akt",
"aktive", "aktive",
"aktueller", "aktueller",
"al", "al",
"al.", "al.",
"ald",
"alf", "alf",
"all", "all",
"allg", "allg",
@ -849,15 +929,21 @@
"an", "an",
"an.", "an.",
"and", "and",
"angestrebt",
"angestrebter",
"ankauf",
"ankaufs-", "ankaufs-",
"ankaufsphase",
"anlagebedingungen", "anlagebedingungen",
"anlagestrategien", "anlagestrategien",
"anlagesusschuss", "anlagesusschuss",
"anlagevehikels", "anlagevehikels",
"annahmen",
"ans", "ans",
"ansprechpartners", "ansprechpartners",
"ant", "ant",
"antagevehikels", "antagevehikels",
"anteilseigner",
"apr", "apr",
"apr.", "apr.",
"are", "are",
@ -867,6 +953,7 @@
"art", "art",
"artikel", "artikel",
"as", "as",
"ase",
"asset", "asset",
"assetor", "assetor",
"assets", "assets",
@ -877,6 +964,8 @@
"attractive", "attractive",
"auf", "auf",
"aufl\u00f6sung", "aufl\u00f6sung",
"aufnahme",
"auftakt",
"aufwertung", "aufwertung",
"auf\u2019m", "auf\u2019m",
"aug", "aug",
@ -885,11 +974,15 @@
"auschittungsrendite", "auschittungsrendite",
"auschu\u0308ttungsrendite", "auschu\u0308ttungsrendite",
"ausgew\u00e4hlte", "ausgew\u00e4hlte",
"ausschlie\u00dflich",
"ausschu\u0308ttung", "ausschu\u0308ttung",
"ausschu\u0308ttungsintervalle", "ausschu\u0308ttungsintervalle",
"ausschu\u0308ttungsrandite", "ausschu\u0308ttungsrandite",
"ausschu\u0308ttungsrendite", "ausschu\u0308ttungsrendite",
"aussch\u00fcttungsintervalle",
"aussch\u00fcttungsrandite",
"aussch\u00fcttungsrendite", "aussch\u00fcttungsrendite",
"aussch\u00fcttungsrendites",
"ave", "ave",
"ax.", "ax.",
"b", "b",
@ -904,6 +997,7 @@
"bd", "bd",
"bd.", "bd.",
"be", "be",
"bei",
"beispielsweise", "beispielsweise",
"belgium", "belgium",
"benefits", "benefits",
@ -921,6 +1015,7 @@
"bhf.", "bhf.",
"biol", "biol",
"biol.", "biol.",
"bis",
"bk.", "bk.",
"bon", "bon",
"br.", "br.",
@ -999,11 +1094,15 @@
"d.h.", "d.h.",
"d.x", "d.x",
"dX", "dX",
"dXxx.\u20ac",
"d_d", "d_d",
"d_x", "d_x",
"dam", "dam",
"darlehen",
"dd", "dd",
"dd.dd.dddd",
"ddd", "ddd",
"ddd.ddd",
"dddd", "dddd",
"de", "de",
"ded", "ded",
@ -1024,6 +1123,7 @@
"dgl.", "dgl.",
"di", "di",
"di.", "di.",
"die",
"different", "different",
"dipl", "dipl",
"dipl.", "dipl.",
@ -1042,6 +1142,7 @@
"du", "du",
"du\u2019s", "du\u2019s",
"dv.", "dv.",
"dxxx.\u20ac",
"d\u00e4nemark", "d\u00e4nemark",
"d\u2019", "d\u2019",
"e", "e",
@ -1060,13 +1161,16 @@
"ebd.", "ebd.",
"ebenda", "ebenda",
"ebr", "ebr",
"ebt",
"economic", "economic",
"ed.", "ed.",
"eep", "eep",
"egr", "egr",
"egt",
"egy", "egy",
"ehem", "ehem",
"ehem.", "ehem.",
"eigenkapital",
"eigentlich", "eigentlich",
"eigtl", "eigtl",
"eigtl.", "eigtl.",
@ -1076,11 +1180,15 @@
"einen", "einen",
"einer", "einer",
"einmalige", "einmalige",
"eins",
"einw", "einw",
"einwohner", "einwohner",
"einzeln",
"eit", "eit",
"ekt",
"el.", "el.",
"eld", "eld",
"eln",
"els", "els",
"em.", "em.",
"en.", "en.",
@ -1090,6 +1198,7 @@
"engl.", "engl.",
"englisch", "englisch",
"enhancing", "enhancing",
"ens",
"ent", "ent",
"entspr", "entspr",
"entspr.", "entspr.",
@ -1100,6 +1209,7 @@
"er.", "er.",
"erd", "erd",
"ere", "ere",
"erfolgten",
"erg", "erg",
"erm", "erm",
"erm.", "erm.",
@ -1110,12 +1220,14 @@
"ery", "ery",
"er\u2019s", "er\u2019s",
"es", "es",
"esg-",
"ess", "ess",
"estate", "estate",
"etc", "etc",
"etc.", "etc.",
"etr", "etr",
"ets", "ets",
"eur",
"europe", "europe",
"european", "european",
"ev", "ev",
@ -1127,6 +1239,7 @@
"experienced", "experienced",
"expertise", "expertise",
"exposure", "exposure",
"externe",
"extract", "extract",
"ez.", "ez.",
"e\u2019s", "e\u2019s",
@ -1136,13 +1249,17 @@
"fa.", "fa.",
"fam", "fam",
"fam.", "fam.",
"fdr",
"feb", "feb",
"feb.", "feb.",
"fen", "fen",
"festen", "festen",
"festgelegt",
"festgelegter", "festgelegter",
"fierce", "fierce",
"fil", "fil",
"finanzierung",
"finanzierungskonditionen",
"flagship", "flagship",
"fond", "fond",
"fonds", "fonds",
@ -1153,6 +1270,7 @@
"france", "france",
"frankreich", "frankreich",
"franz\u00f6sisch", "franz\u00f6sisch",
"fremdkapital",
"french", "french",
"frl", "frl",
"frl.", "frl.",
@ -1162,6 +1280,7 @@
"fs.", "fs.",
"fund", "fund",
"fu\u0308hrende", "fu\u0308hrende",
"f\u00fcr",
"f\u2019m", "f\u2019m",
"g", "g",
"g.", "g.",
@ -1173,6 +1292,7 @@
"gebr", "gebr",
"gebr.", "gebr.",
"gebu\u0308hren", "gebu\u0308hren",
"geb\u00fchren",
"ged", "ged",
"gedis", "gedis",
"gegebenenfalls", "gegebenenfalls",
@ -1185,6 +1305,7 @@
"gen", "gen",
"geographies", "geographies",
"geplantes", "geplantes",
"gepr\u00fcft",
"ger", "ger",
"gerd", "gerd",
"gesamtrendite", "gesamtrendite",
@ -1209,6 +1330,7 @@
"h.", "h.",
"h.c", "h.c",
"h.c.", "h.c.",
"haltedauer",
"halten", "halten",
"halten-strategie", "halten-strategie",
"have", "have",
@ -1217,6 +1339,7 @@
"hd.", "hd.",
"hed", "hed",
"hem", "hem",
"hen",
"here", "here",
"hf.", "hf.",
"hg", "hg",
@ -1227,6 +1350,7 @@
"hinter\u2019m", "hinter\u2019m",
"hip", "hip",
"his", "his",
"hme",
"hotel", "hotel",
"hotels", "hotels",
"hr", "hr",
@ -1303,9 +1427,14 @@
"insb.", "insb.",
"insbesondere", "insbesondere",
"interesting", "interesting",
"invastitionsfokus",
"investftionsvolumen",
"investitionen",
"investitions-annahmen",
"investment", "investment",
"investmentmanagers", "investmentmanagers",
"investments", "investments",
"investmentzeitraum",
"investor", "investor",
"investtionszeltraum", "investtionszeltraum",
"inw", "inw",
@ -1313,6 +1442,7 @@
"iol", "iol",
"ion", "ion",
"ipl", "ipl",
"ird",
"irr", "irr",
"is", "is",
"ise", "ise",
@ -1334,6 +1464,7 @@
"jahre", "jahre",
"jan", "jan",
"jan.", "jan.",
"jedes",
"jh", "jh",
"jh.", "jh.",
"jhd", "jhd",
@ -1346,20 +1477,26 @@
"jun.", "jun.",
"jur", "jur",
"jur.", "jur.",
"j\u00e4hrlich",
"j\u00e4hrliche", "j\u00e4hrliche",
"k", "k",
"k.", "k.",
"k.o.", "k.o.",
"kapitalzusagen",
"kath", "kath",
"kath.", "kath.",
"katholisch", "katholisch",
"kaufen", "kaufen",
"keine",
"kel", "kel",
"ket", "ket",
"key", "key",
"kl.", "kl.",
"klassifizierung",
"kosten", "kosten",
"kt.", "kt.",
"kte",
"kus",
"l", "l",
"l'", "l'",
"l.", "l.",
@ -1452,6 +1589,7 @@
"mitgliedschaft", "mitgliedschaft",
"mo", "mo",
"mo.", "mo.",
"monate",
"monatlich", "monatlich",
"mr", "mr",
"mr.", "mr.",
@ -1474,6 +1612,7 @@
"n.y.", "n.y.",
"n.y.c.", "n.y.c.",
"nach", "nach",
"nachhaltig",
"nachvermietungsstrategie", "nachvermietungsstrategie",
"name", "name",
"nat", "nat",
@ -1493,6 +1632,7 @@
"ner", "ner",
"nes", "nes",
"netherlands", "netherlands",
"neu",
"ng.", "ng.",
"ngl", "ngl",
"ngs", "ngs",
@ -1505,6 +1645,7 @@
"nov.", "nov.",
"nr", "nr",
"nr.", "nr.",
"ns-",
"nsb", "nsb",
"nse", "nse",
"nts", "nts",
@ -1522,10 +1663,13 @@
"o.o", "o.o",
"o.\u00e4", "o.\u00e4",
"o.\u00e4.", "o.\u00e4.",
"o.\u20ac",
"o_0", "o_0",
"o_O", "o_O",
"o_o", "o_o",
"objectives", "objectives",
"objekt",
"objekten",
"of", "of",
"of.", "of.",
"ofQin", "ofQin",
@ -1561,6 +1705,7 @@
"original", "original",
"orm", "orm",
"ors", "ors",
"ote",
"outside", "outside",
"ov.", "ov.",
"ove", "ove",
@ -1609,6 +1754,7 @@
"q.e.d.", "q.e.d.",
"qin", "qin",
"quality", "quality",
"quote",
"r", "r",
"r.", "r.",
"r.i.p.", "r.i.p.",
@ -1630,6 +1776,8 @@
"regionen", "regionen",
"remains", "remains",
"ren", "ren",
"rendite-",
"renovierungen",
"rent", "rent",
"rents", "rents",
"rer", "rer",
@ -1649,6 +1797,7 @@
"rm.", "rm.",
"rms", "rms",
"rn.", "rn.",
"rne",
"rof", "rof",
"room", "room",
"rotterdam", "rotterdam",
@ -1687,7 +1836,10 @@
"sept.", "sept.",
"set", "set",
"sf.", "sf.",
"sfdr",
"sg-",
"sg.", "sg.",
"sich",
"sie", "sie",
"sie\u2019s", "sie\u2019s",
"sis", "sis",
@ -1696,6 +1848,7 @@
"small", "small",
"so", "so",
"so.", "so.",
"sobald",
"sog", "sog",
"sog.", "sog.",
"some", "some",
@ -1709,6 +1862,8 @@
"ss.", "ss.",
"st", "st",
"st.", "st.",
"stabilisieren",
"stabilisierung",
"standortaufwertungsstrategie", "standortaufwertungsstrategie",
"standorte", "standorte",
"std", "std",
@ -1724,17 +1879,20 @@
"strategy", "strategy",
"struktur", "struktur",
"strukturierungsgebu\u0308hr", "strukturierungsgebu\u0308hr",
"strukturierungsgeb\u00fchr",
"st\u00e4dten", "st\u00e4dten",
"sw.", "sw.",
"s\u2019", "s\u2019",
"t", "t",
"t.", "t.",
"tactical", "tactical",
"tag",
"tal", "tal",
"targeting", "targeting",
"targets", "targets",
"tc.", "tc.",
"td.", "td.",
"te-",
"ted", "ted",
"tee", "tee",
"teflimmobilfe)-", "teflimmobilfe)-",
@ -1765,6 +1923,7 @@
"tsd", "tsd",
"tsd.", "tsd.",
"tur", "tur",
"tze",
"t\u00e4gl", "t\u00e4gl",
"t\u00e4gl.", "t\u00e4gl.",
"t\u00e4glich", "t\u00e4glich",
@ -1781,6 +1940,7 @@
"u.u.", "u.u.",
"u.v.m", "u.v.m",
"u.v.m.", "u.v.m.",
"uer",
"ufs", "ufs",
"ug.", "ug.",
"ugh", "ugh",
@ -1797,6 +1957,7 @@
"univ.", "univ.",
"unless", "unless",
"unter", "unter",
"unterstellt",
"unter\u2019m", "unter\u2019m",
"ur.", "ur.",
"ure", "ure",
@ -1826,8 +1987,10 @@
"var", "var",
"vel", "vel",
"ver", "ver",
"verbesserungen",
"vergleiche", "vergleiche",
"vergu\u0308tung", "vergu\u0308tung",
"verg\u00fctung",
"verkaufs", "verkaufs",
"verkaufs-", "verkaufs-",
"very", "very",
@ -1855,9 +2018,11 @@
"walls", "walls",
"way", "way",
"well-established", "well-established",
"werden",
"wertstabile", "wertstabile",
"why", "why",
"wir", "wir",
"wird",
"wir\u2019s", "wir\u2019s",
"wiss", "wiss",
"wiss.", "wiss.",
@ -1895,6 +2060,7 @@
"xx.x", "xx.x",
"xxXxx", "xxXxx",
"xxx", "xxx",
"xxx-",
"xxx-Xxxxx", "xxx-Xxxxx",
"xxx-xxxx", "xxx-xxxx",
"xxx.", "xxx.",
@ -1938,13 +2104,20 @@
"ziel-lty", "ziel-lty",
"ziel-netto-irr", "ziel-netto-irr",
"zielanlagestrategie", "zielanlagestrategie",
"zielm\u00e4rkte",
"zielobjektgr\u00f6\u00dfe",
"zielregionfen)/jand", "zielregionfen)/jand",
"zielrendite", "zielrendite",
"zielsektoren", "zielsektoren",
"zielvolumen", "zielvolumen",
"ziirraiaein", "ziirraiaein",
"zins-",
"zinss\u00e4tze",
"zt", "zt",
"zu",
"zum",
"zw.", "zw.",
"zwischen",
"zzgl", "zzgl",
"zzgl.", "zzgl.",
"{", "{",
@ -1977,11 +2150,14 @@
"\u00f6sterr", "\u00f6sterr",
"\u00f6sterr.", "\u00f6sterr.",
"\u00f6sterreichisch", "\u00f6sterreichisch",
"\u00f6\u00dfe",
"\u00fc", "\u00fc",
"\u00fc.", "\u00fc.",
"\u00fcber", "\u00fcber",
"\u00fcbersicht", "\u00fcbersicht",
"\u00fcber\u2019m", "\u00fcber\u2019m",
"\u00fcft",
"\u00fchr",
"\u0308hr", "\u0308hr",
"\u0ca0", "\u0ca0",
"\u0ca0_\u0ca0", "\u0ca0_\u0ca0",

View File

@ -4,7 +4,7 @@ import json
from pathlib import Path from pathlib import Path
nlp = spacy.load("output/model-last") nlp = spacy.load("output/model-last")
input_pdf = Path("../ocr/output/Pitchbook 3-OCR.pdf") input_pdf = Path("../ocr/output/Teaser 2 FINAL-OCR.pdf")
doc = fitz.open(input_pdf) doc = fitz.open(input_pdf)

View File

@ -202,6 +202,30 @@ TRAINING_DATA = [
( (
"3-4% dividend yield", "3-4% dividend yield",
{"entities": [[0, 4, "AUSSCHÜTTUNGSRENDITE"]]}, {"entities": [[0, 4, "AUSSCHÜTTUNGSRENDITE"]]},
),
(
"Zielmärkte Klassifizierung SFDR Invastitionsfokus Rendite- / Risikoprofil Rechtsform Eigenkapital /FK Quote Investftionsvolumen Prognostizierte Gesamtrendite {IRR)* Prognostizierte Ausschüttungsrandite* Mindestanlage Mitgliedschaft Im Anlagesusschuss Ankaufs- / Verkaufs- / Verkaufs(Teflimmobilfe)- / Baumanagementgebahr (inkl. USt.) Parformanceabhängige Vergütung Einmalige Strukturierungsgebühr Deutsche Metropolregianen und umliegende Regionen mit Städten >50T Einwohner Artikel 8 Wohnimmobilien Deutschland Aktive Bestandsentwicklung Offener Spezial-AlF mit festen Anlagebedingungen rd. 200 Mio. € / max. 20% rd. 250 Mio. € 7,5 % (nach Kosten & Gebühren, vor Steuern) 8 4,0 % {nach Kosten & Gebühren, var Steuern} 5Mio.€ Ab 10 Mio. € 1,40 % / 0,80 % /2,12% / 4,91 % Laufzeit / Investtionszeltraum Ausschüttungsintervalle 20 % über einer @ Ausschüttungsrendite von 4,0 % 0,1% der bis zum 31.12.2023 erfolgten Kapitalzusagen (max. 200.000 &) 10 bis 12 Jahre / bis zu 24 Monate angestrebt Mindestens jährlich",
{"entities": [[945, 960, "Laufzeit"]]},
),
(
"Laufzeit / Investtionszeltraum Ausschüttungsintervalle 20 % über einer @ Ausschüttungsrendite von 4,0 % 0,1% der bis zum 31.12.2023 erfolgten Kapitalzusagen (max. 200.000 &) 10 bis 12 Jahre / bis zu 24 Monate angestrebt",
{"entities": [[174, 189, "Laufzeit"]]},
),
(
"10-12 Jahre Laufzeit bei einem LTV von bis zu 20%",
{"entities": [[0, 11, "Laufzeit"]]},
),
(
"vom Manager festgelegter Stil Rechtsform Jahr des ersten Closings Laufzeit Geplantes Jahr der Auflösung Ziel-Netto-IRR / Gesamtrendite* Zielvolumen des Anlagevehikels Ziel-LTYAktueller LTV Zielsektoren Zielanlagestrategie Fonds Offen Deutschland Core, Core + Offener Immobilien-Spezialfonds 2022 10 - 12 Jahre",
{"entities": [[297, 310, "Laufzeit"], [247, 259, "Risikoprofil"]]},
),
(
"Allgemeine Annahmen Ankaufsphase Haltedauer Zielobjektgröße Finanzierung Investitions-annahmen Zielrendite 24 Monate Investmentzeitraum 10 Jahre (+) EUR 20-75 Mio. Keine externe Finanzierung zum Auftakt (ausschließlich Darlehen der Anteilseigner). Die Finanzierung wird nach der Ankaufsphase und Stabilisierung der Zinssätze neu geprüft. Angestrebter LTV zwischen 25-40 % Investitionen für Renovierungen und ESG- Verbesserungen werden für jedes Objekt einzeln festgelegt. 5,00-5,25 % Ausschüttungsrendites",
{"entities": [[136, 148, "Laufzeit"], [472, 483, "Ausschüttungsrendite"]]},
),
(
"Zielrendite 5,00-5,25 % Ausschüttungsrendite 1) Ankauf von Objekten an Tag eins mit 100% Eigenkapital. Die Strategie unterstellt die Aufnahme von Fremdkapital, sobald sich die Zins- und Finanzierungskonditionen nachhaltig stabilisieren. Strategie - Übersicht Risikoprofil Core+",
{"entities": [[12, 23, "Ausschüttungsrendite"], [272, 277, "Risikoprofil"]]},
) )
] ]