探検


検索エンジンつくりたい

03/09/14 17:52ID:???
初めまして、エロイ人です。
仕事で検索エンジンの作成やチューニングもやっています。
何を聞きたいのですか?
3
垢版 |
03/09/14 17:52ID:???


03/09/14 18:06ID:???
なんで>>1みたいな糞がちょくちょく現れるのかなぁ
03/09/14 18:10ID:???
>>1
なにもわからないやつには無理。
基本的なことを学んでから出直して来い。
03/09/14 18:11ID:???
>>4さんが毎日排泄するように
日夜を問わず製造されているのでは無いでしょうか?
03/09/14 18:13ID:???
>>5
そういう排他的な考えではいけませんね。
何事も最初は知識0から始めるものです。
まず検索エンジンとはどういう仕組で成り立っているのか考えてみては如何でしょうか?
仕組みを分割していくと幾つかに分類できていくことができると思います。
03/09/14 18:16ID:???
>>7
後半2行は>>1に言ってやれ
03/09/14 18:24ID:???
>>1
そんなのフリーで配布してるやつ使え
03/09/14 18:31ID:???
>>7
失礼しました。
リンクをはるのを失念していました。
11ユリ
垢版 |
03/09/14 18:42ID:???
>>2
えっと、具体的にはYomi-Searchみたいなのをやりたいんですけど、
まったくわからないんです。
どうしたらいいんですか?
03/09/14 18:53ID:???
Yomi-Searchのソースは配布されてますよね。
それをダウンロードして中を見ても、全く分からないということですか?
分からない原因は何でしょうか?
perlで書かれているがperl自体を知らないというのであれば、
perlを勉強するのが一番でしょう。
perlは知らないが他の言語なら分かるというのであれば、
perlのリファレンスを見つつ他の言語に書き直してみるのもいいかも知れません。
言語なんてどうでもいいんだ、オレはディレクトリ型サーチが何を目指しているのか知りたいんだ、
という場合は哲学への道を進んでみるのも手だと思います。
>>1に作りたいとあったので、まずperlなりphpなり必要な手段(言語)を身に付けるところから始めてみては如何でしょうか?
03/09/14 19:24ID:???
>>12
同意
14 
垢版 |
03/09/14 19:48ID:???
概論
http://www.searchengineoptimization.jp/seo_foundation/index.html
03/09/14 20:49ID:???
誰も書いてないから書くけど、共有サーバを使うのはやめようね。

16ユリ
垢版 |
03/09/14 21:57ID:???
ホームディレクトリ(ここでは public_htmlディレクトリとします)の下に、「naviディレクトリ」を作成し、さらにその下にロックファイル用ディレクトリの「lockディレクトリ」を作成します。
全体のディレクトリ構成とファイル位置の設置例は以下のとおりです。(かっこ内はパーミッションの設定値)
【構成例】

public_html / index.html (トップページ)
|
+-- navi / navi.cgi [755]
| navi.log [666]
| jcode.pl [644]
| bkup.dat [666]
| A.bak [666]
| B.bak [666]
| C.bak [666]
| new.gif
| recom.gif
|
+-- lock [777] /

↑これがよくわかりません。だれか教えてください。
03/09/14 22:04ID:???
>>16
>>5
03/09/14 22:16ID:???
なるほど。yomi-searchは内部が複雑なので
簡単そうなCOSMO NAVIで来ましたか。いい選択です。

さて本題ですが、「これ」というのはパーミッションのことでしょうか?
単純にアップロードすれば表示されるHTMLと違い、
CGIの場合はプログラムを実行した結果を表示します。
そのための準備の一つにパーミッションの設定があります。
面倒なので略。
19ユリ
垢版 |
03/09/14 22:21ID:???
◎CGIのご利用方法

CGIを利用される場合には、cgi-binというディレクトリを作成し、その中に
CGIを設置してください。拡張子は必ず.cgiとし、属性を700にしてくだ
さい。PerlのPATHは /usr/bin/perl となります。
HTMLファイルからCGIを参照する場合は次のように指定してください。
 /blcs/cgi-bin/CGIファイル名

↑なんかマニュアル通り設定だとダメみたいなんですけど、どうすればいいのでしょうか。。。
03/09/14 22:34ID:???
なんでみんなこんな優しいの? 過疎だから?
03/09/14 22:43ID:???
>20
高校生だからだろw
03/09/14 22:51ID:???
>>20
こども相手にあんまキツイことをいってもアレだろw
03/09/14 22:59ID:???
>>1が高校3年生「たけし」でも、そのやさしさでレス出来たかな?
03/09/14 23:04ID:???
つーか、スレ違いだろうが単質だろうが相手にする教えたがり厨がいるよな
03/09/14 23:11ID:???
>>23
なんで、男にやさしくしなきゃならんのだ?
03/09/14 23:13ID:???

          / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
         /基礎的な知識がやや不足気味のような気がします。
  ∧_∧   / 参考になるような本を一冊読み終わってから始めてみては如何でしょうか?
 ( ・∀・)<   Web上の情報としては、yahooの
 ( 建前 )  \ トップ > コンピュータとインターネット > インターネット > WWW > CGI
 | | |    \カテゴリが参考になると思います。
__(__)_)______________
 ( _)_)
 | | |
 ( 本音 )  / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ( 。A。)< 即実装の話に入れるたけし君カモーン
  ∨ ̄∨   \_______________
03/09/15 13:22ID:???
Yomiよりいい感じの検索エンジン作ろう
03/09/15 14:11ID:???
いい感じの意味が曖昧ですね。
がんがってください。
29nobodyさん
垢版 |
03/09/18 20:52ID:BrtN4d/+
マジな話、検索ページをHTMLで生成される
検索エンジンが欲しいのだが、そういうのって可能?
製作するならぶっちゃけいくら必要になる?
03/09/18 21:23ID:???
打ち捨てられたこのスレへようこそ。
幾つか確認させてください。

検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?
03/09/18 21:51ID:???
>>30
検索されるたびにキャッシュしていくとか


あんまり意味ない気がするんだが
32nobodyさん
垢版 |
03/09/18 22:24ID:nGSwS+tg
>検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
>つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?

Googleは、これをやっているのでは? でなきゃ、なんで
あんなに速いんだ?
03/09/18 22:30ID:???
HTMLページの表示にどれだけ時間がかかるっていうんだよ
検索結果の一部はキャッシュしてるだろうが、ページの生成は
動的だろ
03/09/18 22:56ID:???
>>32
Googleのでータベースはメモリ上に常駐してるって聞いたが
35nobodyさん
垢版 |
03/09/18 23:59ID:BrtN4d/+
>>30
まぁ、そういう事ですかね。
普通のフリーの検索エンジンCGIなら
登録画面や検索結果表示画面は.cgiになります。
が、表示の速さやエラーの問題もあって.htmlである必要があるのです。

というわけでマジ見積もりお願いします。
03/09/19 00:12ID:???
想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくのは無理


-----end
03/09/19 00:37ID:???
>>35
>登録画面や検索結果表示画面は.cgiになります。
HTMLにすりゃいいじゃん
38nobodyさん
垢版 |
03/09/19 01:08ID:di5whLiA
>>37
それをできるかどうか聞いているのですが。
それともJavascriptかなにかで代用することを
言いたいのですか?
03/09/19 01:53ID:???
>>38
例えば2chの板にindex.「html」が表示されるでしょ?
カキコするとbbs.cgiにPOSTするでしょ?
そしたらそのカキコがまたindex.「html」に表示されるでしょ?
40nobodyさん
垢版 |
03/09/19 02:19ID:di5whLiA
>>39
まぁ、形はどうあれ登録サイトがhtmlで表示されていればいいんです。
あなたがそういう形式の検索エンジンを作成できるなら
だいたいいくらで請け負うか教えていただけませんか?
参考にしますので。
03/09/19 07:34ID:???
>40
登録サイトの想定件数はいかほどですか?
42nobodyさん
垢版 |
03/09/20 11:51ID:pAE1Wngt
>>41
返事遅れてすみません。。
1万が目標です。現在600です。
03/09/20 19:25ID:???
> 1万が目標です。現在600です。

03/09/20 21:21ID:???
http://daikon72.hp.infoseek.co.jp/cgi-bin/lock/renbari2813.mpg
これなんだ?
03/09/21 03:52ID:???
>>42
カテゴリ分けしてるYahooみたいなのとは違うの?
つーか、確認しときたいけど拡張子がhtmlのcgiを作ってくれって事じゃないよね?
それなら.htaccessいじくりゃすむ話・・・・

登録の単語は手動で行なうのかな?
例えば、俺があるサイトの管理人で、その登録をしようとする。
その時に、
1.サイトのアドレスと、登録したいWordをいくつか一緒に書く。
そしたら、その登録Wordで検索した時のみそのサイトが表示される・・・

2.サイトのアドレスのみ書く。
そしたら、そのサイトを見た管理者が、そのサイトに適当なワードをいくつか並べて、
そのWordで検索した時のみそのサイトが表示

3.同じくサイトのアドレスのみ書く。
すると、ロボットがそのサイト内を検索し、重要そうな単語を拾う。
その単語でのみ検索可。

1と2はそんなに変わるもんでもないけど、3はメンドクサイな。
当然そこで値段も変わってくるわけだが。

ぶっちゃけ、依頼する場所によって値段は大幅に変わるだろうけど、
まともなとこに依頼するとして、1とか2ならデザイン抜きで150万。
3ならその倍くらいかと。
保守は当然別料金。
4642
垢版 |
03/09/21 09:10ID:31jhVBaJ
>>45
簡単に言うとYomi-searchを軽くして
データが増えても検索したら1秒ぐらいで表示されるものですかね。
ランキングとかはいらなくて。

で、拡張子が.htmlというのはとりあえずGoogleなどの
検索エンジンで各検索結果のページがロボットに拾われるようにしたいんです。
だから表示画面は.htmlがいいわけで。
.htaccessを使うと出来ると言うのは知らなかったです。

で、上記のようなものがフリーであればその制作者に
かけよって権利を譲っていただく交渉しようと考えていたし
無ければ独自で制作依頼をしたいなっと思っていました。

コスト的に結構、かかるんですね。参考にします。ありがとうございました。
47nobodyさん
垢版 |
03/09/21 09:59ID:kPJ/tg2Z
>>46
おいおい、検索の結果なんて他のロボットは拾わないだろ。
検索のボットが自動で検索する訳じゃあるまいし。

例えば「2ch cgi」で検索した結果をリンクとして貼ってあったとして
それを拾ってもらいたいなら*.phpにすればいい。
Googleなら拡張子phpは拾ってくれるから。
後ろに引数が付いてる場合はどうかは知らんが。
03/09/21 14:42ID:???
なんか>>42はいろいろ勘違いしてそうだな
03/09/22 00:35ID:???
↓こんなんでいいか?
ttp://cgi.cyborg.ne.jp/~hironori/cgi-bin/
50nobody
垢版 |
03/09/22 21:57ID:???
2003年9月20日 全文検索ソフト G-Search Personal - ベクターソフトニュース - http://www.vector.co.jp/magazine/softnews/030917/n0309174.html

全文検索ソフト G-Search Personal
ハードディスク内のWord/Excel/PowerPoint/TXT/HTML/PDFファイルを全文検索するソフト
--------------------------------------------------------------------------------
● 全文検索ソフト G-Search Personal Ver.1.12
作 者 : ゆうき さん
対応OS : Windows XP/2000/98/95/NT
種 別 : フリーソフト
作者のホームページ : http://www36.tok2.com/home/yuuki05/

■Windows XP/2000/98/95/NT  ■フリーソフト 検索キーワードが含まれているファイルがリストアップされる

ハードディスクなどに保存されている、Word/Excel/PowerPointファイル、テキストファイル、HTMLファイル、Acrobat PDFファイルを対象に全文検索を行えるソフト。
検索対象はドライブ/フォルダ単位で指定する。ローカルディスクのほか、ネットワークドライブやCD-ROMドライブなども検索対象に含めることができる。
指定したフォルダより下の階層のフォルダは自動的に検索対象となる。
検索するファイル形式はユーザが選択することが可能。
初期設定ではDOC/XLS/PDFファイルが検索対象となっているが、PPT/TXT/HTML(HTM)を追加することも可能で、指定形式のファイルのみを対象に検索できる。
03/09/22 22:08ID:???
>>50
板違い
5242
垢版 |
03/09/22 23:46ID:GFhRbp8t
すみません、、激しく勘違いしていました。。
基本的にYomi-searchで望むことは大体出来ました。

あとは、Yomi-Searchより高速で処理の速い+αの
検索エンジンを作れないものですかね?
単純にYomi-SearchのPHP版を使用したらいいというわけではないし。
03/09/22 23:53ID:???
今の君には無理だから勉強しなさいな
5442
垢版 |
03/09/22 23:57ID:GFhRbp8t
>>53
いや、自分で作るのではないです。外注するのです。
その場合のコスト見積もりを29から聞いているわけで...
03/09/23 00:05ID:???
外注ならそういう仕様で見積もり依頼すりゃいいじゃないの。
56nobodyさん
垢版 |
03/09/23 03:13ID:2l0WTZfM
引越しじゃないけど、>>55の言う通り複数の業者に見積もり依頼すればいいよ。
見積もりもできないようなとこには発注しない。
不況で買い手市場(多分)なはずだから、値切ったりもできるかもよw
57nobodyさん
垢版 |
03/09/23 08:33ID:cAN9O/VY
コンペ開始↓

とりあえず50万でどうさ?
04/02/19 20:41ID:???
検索エンジン作成に関してのスレは
こちらにまとめましょう。

検索エンジンをつくりたい
http://pc2.2ch.net/test/read.cgi/php/1009030584/l50
59名無しさん
垢版 |
04/10/08 01:01:26ID:TPGoBuLX
サーチエンジン
http://umasql.netkeiba.com/db/horse.php?hid=2000101537
04/10/09 14:59:47ID:???
こんなスレが一年もあるとは・・・しかも3つ上の日付が一年以上前だ
04/12/15 19:53:25ID:???
age
62nobodyさん
垢版 |
04/12/20 05:40:32ID:cWC8ojNe
まだあった、ここ・・・
とりあえず、巷で使われてる検索エンジンでも分類してみてはどう?
中小でも独自エンジンで使い勝手の良さそうなエンジンがある。
そこのコンタクト取るのが一番早い。
得てして非公開だがね
04/12/20 06:33:51ID:???
漏れも手伝ってやるよっ!

まずは高速手動型エンジンね
http://www.8823.net/
04/12/20 06:35:39ID:???
補足

ここはエンジン内部公開してるようですねえ
http://www.8823.net/new/koukai.html
65nobodyさん
垢版 |
04/12/20 08:00:52ID:SmxJcj5b
形態素解析・n-c・フルサーチ
まじめに作ってみたいなぁ・・・
66jibook
垢版 |
05/01/14 18:28:26ID:TjNuM0Sd
皆さんはどこで運営、作成していますか?
67jibook
垢版 |
05/01/14 18:29:24ID:TjNuM0Sd
皆さんはどこで運営、作成していますか?
68nobodyさん
垢版 |
05/03/13 19:43:27ID:cxiEkR1N
第2回検索エンジンアンケート実施中!

http://hp6.0zero.jp/anq/anq.php?uid=1696&dir=84
69nobodyさん
垢版 |
2005/07/27(水) 05:07:42ID:VXg0NE9b
ロボット型検索エンジン作ればいんじゃん
2005/07/27(水) 11:06:06ID:???
>>1

そんなん作ったらあっと言う間にアカウント消されるよ

一応作り方は

sql+php

----------------------はい終わり--------------------------
NGNG
検索エンジンは鯖に負担かかりますからねw
72モンゴルイタリア人12世
垢版 |
2006/03/20(月) 17:21:41ID:PIteGTUG
グーグルのを借りれば?
ライブドア見たいに
73nobodyさん
垢版 |
2006/03/25(土) 03:04:13ID:zWnWakqL
費用はどのくらいかかるんですかね?
74nobodyさん
垢版 |
2006/03/26(日) 17:42:26ID:R1D5eEFB
無料だよ
2006/03/27(月) 17:07:36ID:???
単に使いたいだけなのか、作る事に興味があるのか分からんな。
2006/03/30(木) 17:26:30ID:???
人口無能検索エンジンを作ります。
全然キーワードとマッチしないサイトを拾い上げるロボット型検索エンジン
77モンゴルイタリア人12世
垢版 |
2006/12/28(木) 20:58:08ID:PxIYLsOg
かつてない検索エンジンをつくらないと、人気がでないよ
2006/12/28(木) 22:19:28ID:???
画像検索創ってよ、あったようなきもするけど
2006/12/29(金) 04:43:00ID:???
ヒント:グーグル
80nobodyさん
垢版 |
2006/12/29(金) 12:51:51ID:oDxgb420
画像で検索ってどこに載ってる?ググル
81ぴっと
垢版 |
2007/01/31(水) 20:58:47ID:Fl42X7jm
私は13歳の中1です。
Naku’s Japanの設立者です。

検索エンジンの作り方おしえてください。
できればロボット型のほうを・・・・・
2007/02/01(木) 01:44:04ID:???
昔、中学生が作ったロボット型サーチエンジンがあったぞ
(いまもあるのかもしれんが)
namazu使ってたんだったけか
ロボットの走らせ方は検索すれば出てくるだろ
まあがんばれやw
2007/02/01(木) 11:56:42ID:???
2ちゃんねらーはねこだいすき
http://makimo.to/cgi-bin/cache/index.cgi?img=http://www.uploda.org/uporg666494.jpg
2007/02/01(木) 23:04:12ID:???
ちゅうがくせいでもできる ぶろぐ あふぃりえいと
2007/09/28(金) 05:22:51ID:???
誰か教えてください ある会社に勤めていますが
そこでPC4台を使って仕事の資料ホームページを作成しました
その中に検索システムを作成したいのですが
外部ネットワークに繋ぐのは不可能なんです
(会社の情報もあるのでPC4台内だけで動かしたい)
PC4台はハブでつながっています 可能なのか不可能なのか
わかる方教えてください もし出来るならどのような言語から覚えたら良いですか?
HTMLくらいしかわかりません お願いします
2008/09/04(木) 01:54:41ID:???
>>85
可能
習得が早いphpでもやっときゃおk
2008/09/04(木) 10:27:29ID:???
>>85
こっから探せ
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html#free_jp
88nobodyさん
垢版 |
2008/09/26(金) 23:46:01ID:YewbVftQ
なんだ?ここ
2008/09/26(金) 23:59:21ID:???
あのね ここはね 2ちゃんねるっていってね

そこそこの規模の掲示板なんだよ
2008/11/14(金) 16:42:13ID:???
http://www.seo-ch.com/raku-search
2012/03/11(日) 14:04:04.27ID:????PLT(12078)
>>1はもう検索エンジン作れたか?
92nobodyさん
垢版 |
2013/10/29(火) 21:49:23.26ID:z4zTbkHZ
>>1
5年ぶりにageてみるけど、意味ないな。
93nobodyさん
垢版 |
2013/11/10(日) 00:23:27.89ID:OF1ojZRd
386 :名無しさん@お腹いっぱい。:2013/11/05(火) 22:43:17.55 ID:ienXsxbb
>>378
「ライヤーゲーム」って知らないの?


387 :名無しさん@お腹いっぱい。:2013/11/05(火) 23:51:04.45 ID:P27Y9boe
>>378
鬼の首とったかのように勝利宣言してるところ悪いけど、liarはライアーでもライヤーでも間違いではないよ
victoryをビクトリー「なんて読んでたら、即座に指摘される」かな?


388 :名無しさん@お腹いっぱい。:2013/11/06(水) 00:39:03.37 ID:atxSCjuQ
>>386
知らない。検索してみたがそんなのなかった。


389 :名無しさん@お腹いっぱい。:2013/11/06(水) 00:52:57.18 ID:9438j31N
>>388
どんなしょぼい検索エンジン使ってんだよw


http://anago.2ch.net/test/read.cgi/slotk/1382525961/99-999
2013/11/22(金) 20:59:27.37ID:???
たけしー
2013/11/29(金) 09:38:17.47ID:???
例えばFC2において、「ドラマ」で検索した場合、
誰も見ないような朝鮮、中華ドラマも一緒に表示されるんですが、
排除条件のようなものを作り、こういったものを表示させないようにして欲しい
かなりの人が欲しい機能
96nobodyさん
垢版 |
2013/12/03(火) 20:16:20.30ID:JDkHKCU3
403 :名無しさん@入浴中:2013/11/25(月) 00:14:17.89 ID:izyUbVX10
139 :「名無しわざとか?」とかイヤミを言われた:2013/11/24(日) 23:14:17.20 ID:zfd4SHfE
>>136
今夜のずりネタとして目に焼き付けに行くのが目的でしたが、貴方のおかげで大勝でき、フラミンゴ→クリスタル京都とはしごさせて頂きました
ごちっす!


140 :「名無しわざとか?」とかイヤミを言われた:2013/11/25(月) 00:13:20.91 ID:K9fTpS1+
>>129
川崎,蒲田


http://kohada.2ch.net/test/read.cgi/slotj/1382413382/l50


404 :名無しさん@入浴中:2013/11/25(月) 00:32:13.79 ID:i/iZ7DyX0
遊び方なんて人それぞれだから関係ないだろw
オレはオナニーがわりに新人ばっかり週3くらい入ってるが新人多すぎて入りきれない
本当は週3は多すぎて逝けない事もしばしばなんだけど
新人見るとどうしても行っちゃうし外してもよっぽどでなければ何とも思わない

http://kilauea.bbspink.com/test/read.cgi/soap/1384255463/403-404
97nobodyさん
垢版 |
2014/01/30(木) 20:33:58.02ID:Ipx7pFuj
グーグル検索エンジンの進化
http://webblogsakusei.main.jp/seo-taisaku-matt-cutts-toha-2014-google-hummingbir.html
98sage
垢版 |
2014/09/06(土) 20:15:50.33ID:ziKikuCk
こんなのが出るっぽい。

検索エンジン自作入門 〜手を動かしながら見渡す検索の舞台裏
http://gihyo.jp/book/2014/978-4-7741-6753-4
99nobodyさん
垢版 |
2017/12/30(土) 13:16:34.44ID:YhlYw6jg
誰でも簡単にネットで稼げる方法など
参考までに、
⇒ 『半藤のブブイウイウレレ』 というサイトで見ることができます。

グーグル検索⇒『半藤のブブイウイウレレ』

IR8C9YDWVB
100nobodyさん
垢版 |
2018/11/07(水) 17:32:01.92ID:???
仕事で3000サイト限定の検索エンジン(というかクローラー)作ったけどかなりめんどかった。
本文以外の文字をいかに除外するかが難問。
これはGoogleですら不完全。
完全汎用化はできずにある程度サイトごとにカスタマイズするハメになった。
しかし、今ならAIで精度上げられるのではないだろうか。
101nobodyさん
垢版 |
2023/10/14(土) 15:31:43.44ID:???
幸せなら俺が幾らでも分けてあげる!
レスを投稿する


ニューススポーツなんでも実況