ヤフーのような検索エンジンを作って、
自力で商用化をしたいんだけれど、
開発費用っていくらぐらいかかる?
信頼のおける技術者も探しています。
検索エンジンをつくりたい
1yam ◆AyW.Rdbg
01/12/22 23:16ID:???175nobodyさん
04/03/21 21:30ID:??? Googleってどうやって稼いでんの?
177nobodyさん
04/03/22 16:47ID:??? >>172
MS-Officeでイルカの消し方がFAQになることと、Googleが好ましいとされる理由に「余分なインターフェースがない」が上位に挙げられることを思うと、あまり成功しない気がするよ。
検索エンジンとつながるマスコットが昔あったような気がするな。打ち込んだキーワードを学習して、時々新しいURLを勝手に拾ってきては、飼い主に「みてみて」とせがんでくる奴。
MS-Officeでイルカの消し方がFAQになることと、Googleが好ましいとされる理由に「余分なインターフェースがない」が上位に挙げられることを思うと、あまり成功しない気がするよ。
検索エンジンとつながるマスコットが昔あったような気がするな。打ち込んだキーワードを学習して、時々新しいURLを勝手に拾ってきては、飼い主に「みてみて」とせがんでくる奴。
178172
04/03/23 00:02ID:???179nobodyさん
04/03/23 00:47ID:??? オールアバウトのリンク集を拾ってきて検索させれば精度のいい検索サイトになるかも。
要はそのサイトを誰かが評価してあればいいんだよ。
昔はNTTの新着情報からのアクセスが一番多かったものだけど、
ググルに新着情報ページがあれば結構アクセスあるかもね。
要はそのサイトを誰かが評価してあればいいんだよ。
昔はNTTの新着情報からのアクセスが一番多かったものだけど、
ググルに新着情報ページがあれば結構アクセスあるかもね。
180nobodyさん
04/03/31 22:06ID:??? 会話をキーボードでタイプするくらいなら、キーワードだけタイプしたほうがいいけど、
音声で会話できるなら、会話型インタフェースも悪くないと思うよ。
音声で会話できるなら、会話型インタフェースも悪くないと思うよ。
182nobodyさん
04/06/05 23:35ID:KbDZzecN a
183nobodyさん
04/06/10 01:45ID:??? ところで、データはどやって集めるの?
いずれはユーザに登録させるとしても、最初は
人力で集めるんでしょ?
リンクの多そうなサイトを登録して、そこから
リンクたどってって、徐々に増やしていくとか?
自分も特定の分野の検索サイトをやりたいんだけど、
エンジン作りに挑戦してみようかな。
どっかに、検索エンジンの基本部分を解説してる
サイトってない?
いずれはユーザに登録させるとしても、最初は
人力で集めるんでしょ?
リンクの多そうなサイトを登録して、そこから
リンクたどってって、徐々に増やしていくとか?
自分も特定の分野の検索サイトをやりたいんだけど、
エンジン作りに挑戦してみようかな。
どっかに、検索エンジンの基本部分を解説してる
サイトってない?
184nobodyさん
04/06/10 20:45ID:??? Yomi-Searchでも弄っとけ
185nobodyさん
04/06/19 21:21ID:??? ロボット検索エンジンはどうやって
作ればいいのかわかる奴いますか?
「クローラの自動巡回でデータ集める」
ってどうやるんだよ・・・分かんねぇ。
作ればいいのかわかる奴いますか?
「クローラの自動巡回でデータ集める」
ってどうやるんだよ・・・分かんねぇ。
189nobodyさん
04/07/02 03:03ID:wbSwwq8f 他スレで質問しましたが、スレ違いだったようなのでこちらで質問させて下さい。
【必要な機能】 ロボット検索技術を応用した、インターネット上の販売情報を検索することができるソフト。商品名やスペック等からリアルタイムな情報を検索することができる。その得た情報をMYSQLなどのDBに落とし込みたい。
【. 目 的 】 リアルタイムに価格比較できるPC比較サイトを作りたい
【. 使用OS 】 windowsXP
【. 条 件 】 10万以内なら払いたい
■試したけど条件を満たさなかったソフト
【. 名 称 】 まったく見つからず
■これだけはやりました
【 >>1-10、FAQ集、上手な検索の仕方 を読んだ 】 はい
【 調べたサイトの名前 】 GOOGLE YAHOO など大手検索エンジン
【検索キーワードは? ..】 ロボット型検索技術 クロール ソフト
恐らくこのようなソフトはないと思います。。
この技術の最も単純なソフト。もしくは応用が聞くような単純ソフトがあれば・・・・などと不遜にも考えています。
ちなみに下記2サイトで私がやりたいような事を行っております。
http://www.bestgate.net/
http://yasune.dokoda.jp/
このような技術の雛形などご存知の方いましたらどうかご教授下さい。
【必要な機能】 ロボット検索技術を応用した、インターネット上の販売情報を検索することができるソフト。商品名やスペック等からリアルタイムな情報を検索することができる。その得た情報をMYSQLなどのDBに落とし込みたい。
【. 目 的 】 リアルタイムに価格比較できるPC比較サイトを作りたい
【. 使用OS 】 windowsXP
【. 条 件 】 10万以内なら払いたい
■試したけど条件を満たさなかったソフト
【. 名 称 】 まったく見つからず
■これだけはやりました
【 >>1-10、FAQ集、上手な検索の仕方 を読んだ 】 はい
【 調べたサイトの名前 】 GOOGLE YAHOO など大手検索エンジン
【検索キーワードは? ..】 ロボット型検索技術 クロール ソフト
恐らくこのようなソフトはないと思います。。
この技術の最も単純なソフト。もしくは応用が聞くような単純ソフトがあれば・・・・などと不遜にも考えています。
ちなみに下記2サイトで私がやりたいような事を行っております。
http://www.bestgate.net/
http://yasune.dokoda.jp/
このような技術の雛形などご存知の方いましたらどうかご教授下さい。
190nobodyさん
04/07/02 03:08ID:???191nobodyさん
04/07/02 03:52ID:??? でもクローラってどうやるのかまじで知りたい
192nobodyさん
04/07/07 01:24ID:??? 何かに特化したサーチエンジン、というかデータベースなら需要がある
だろうが、でなければ意味ないわ。
価格比較にしても、まずは価格比較サイトにいくだろ。ロボットで価格を
漁るということに何の意味も見いだせない。
クローラーは単純だ。「波乗り野郎」みたいなもんだ。
ttp://www.bug.co.jp/nami-nori/
だろうが、でなければ意味ないわ。
価格比較にしても、まずは価格比較サイトにいくだろ。ロボットで価格を
漁るということに何の意味も見いだせない。
クローラーは単純だ。「波乗り野郎」みたいなもんだ。
ttp://www.bug.co.jp/nami-nori/
193nobodyさん
04/07/23 16:09ID:ackJdXhi これも特化した検索サイトだな
http://www.surpara.com/
http://www.surpara.com/
194nobodyさん
04/09/03 04:40ID:bPh7a+Nk yomiスレ死んだ?
195名無しさん
04/10/08 01:02:54ID:TPGoBuLX196nobodyさん
04/10/10 23:39:08ID:FanGpL5a ディレクトリ型検索エンジンなんてDB使えば結構簡単に作れるんジャン?
Googleみたいなロボット巡回型は相当難しそうだけど
Googleみたいなロボット巡回型は相当難しそうだけど
197nobodyさん
04/10/10 23:40:21ID:FanGpL5a 3年前の話か、、、
198nobodyさん
04/10/13 16:43:48ID:??? 100−200ぐらいのサイトのキャッシュをためてそこから検索する
グーグルの規模を小さくしたような検索エンジン・・・ないよな
グーグルの規模を小さくしたような検索エンジン・・・ないよな
199nobodyさん
04/10/13 21:56:37ID:??? ttp://www.dtm.ac/
ここオリジナルのロボットで運営してるよ
ここオリジナルのロボットで運営してるよ
200nobodyさん
04/12/15 19:54:07ID:??? age
201nobodyさん
04/12/20 08:16:35ID:??? ロボット型検索エンジン作りたい奴、
頼むから爆撃アクセスするようなロボットは作らないでくれな。
robot.txtやMETAタグには従うように。
どうせIPで弾くだろうけどな。
頼むから爆撃アクセスするようなロボットは作らないでくれな。
robot.txtやMETAタグには従うように。
どうせIPで弾くだろうけどな。
202nobodyさん
04/12/20 10:55:13ID:SmxJcj5b うわーすごいのびてる。
さっき書き込んだときは60くらいだったのに。
さすが2チャンネルだなぁ。
さっき書き込んだときは60くらいだったのに。
さすが2チャンネルだなぁ。
203nobodyさん
04/12/23 23:53:23ID:yKblct4O 検索エンジンをつくりには、
1.Inverted File Structureを勉強すること。
2.形態素解析
3.ロボットのこと テキストだけ抜き鳥。
1.Inverted File Structureを勉強すること。
2.形態素解析
3.ロボットのこと テキストだけ抜き鳥。
204nobodyさん
04/12/24 00:28:16ID:nkV22Kja205nobodyさん
05/03/13 19:43:57ID:cxiEkR1N206nobodyさん
05/03/14 19:36:30ID:??? 鯰じゃだめなのか?
207nobodyさん
2005/03/22(火) 21:31:01ID:??? 鯰でいい。
208nobodyさん
2005/03/23(水) 03:34:58ID:NriJPZTB 正直このスレでいいのか分からないのですが、
検索ロボットとオンラインブックマークの関係について教えて下さい。
(初心者用質問スレが落ちたみたいなので?こちらに書いています)
具体的には、
オンラインブクマに登録されたサイトは検索ロボに登録されてしまうのか
が知りたいのです。
サイト自体は.htaccess、robot.txt、METAタグで
検索ロボを回避する様に設定しているのですが、
・オンラインブクマもロボットの検索対象になるのか(これはなる様な気がする)
もし検索対象になるのであれば、
・オンラインブクマに登録されたURLはそのまま検索ロボに登録されるのか
・もしくは、ブクマされたURLに飛んでからロボ避けがなければロボに登録されるのか
というのがぐぐっても分かりませんでした。
もしスレ違い、板違いでしたら申し訳ありません。
その際は誘導して頂けると嬉しいです。
どうぞよろしくお願い致します。
検索ロボットとオンラインブックマークの関係について教えて下さい。
(初心者用質問スレが落ちたみたいなので?こちらに書いています)
具体的には、
オンラインブクマに登録されたサイトは検索ロボに登録されてしまうのか
が知りたいのです。
サイト自体は.htaccess、robot.txt、METAタグで
検索ロボを回避する様に設定しているのですが、
・オンラインブクマもロボットの検索対象になるのか(これはなる様な気がする)
もし検索対象になるのであれば、
・オンラインブクマに登録されたURLはそのまま検索ロボに登録されるのか
・もしくは、ブクマされたURLに飛んでからロボ避けがなければロボに登録されるのか
というのがぐぐっても分かりませんでした。
もしスレ違い、板違いでしたら申し訳ありません。
その際は誘導して頂けると嬉しいです。
どうぞよろしくお願い致します。
210nobodyさん
2005/04/30(土) 21:14:50ID:MqigPbvB ちょっと真面目に検索エンジンについての話なんだが、
登録数100万件なら、どのぐらいのスペック(サーバー)が必要なんだ?
情報求む。
登録数100万件なら、どのぐらいのスペック(サーバー)が必要なんだ?
情報求む。
212nobodyさん
2005/05/06(金) 00:17:36ID:??? >>211
「簡単なサンプルプログラム」とは?210じゃないけど。
というか、ロボットは別としてディレクトリ型で
大手の検索エンジン以外で数十万単位の登録ってあるんだろうか?
そしてテキストだけならほぼ普通のレン鯖でも処理出来る気が
するのだが、あくまでも「気がする」程度なのだろうか・・。
「簡単なサンプルプログラム」とは?210じゃないけど。
というか、ロボットは別としてディレクトリ型で
大手の検索エンジン以外で数十万単位の登録ってあるんだろうか?
そしてテキストだけならほぼ普通のレン鯖でも処理出来る気が
するのだが、あくまでも「気がする」程度なのだろうか・・。
213nobodyさん
2005/05/06(金) 17:34:05ID:??? >>212
いきなり、実稼動するわけじゃないんだから。。。
ローカルで動くシステムを作ってみれば
どのくらいの負荷がかかるとかわかるでしょ?
そこに、信頼性や要求なんかを加味して
そこから逆算してくださいな
ってことです
そう言えば、昔「ディレクトリ型はロボット型の対義語じゃない」って怒られたっけ
思い出しちゃった
いきなり、実稼動するわけじゃないんだから。。。
ローカルで動くシステムを作ってみれば
どのくらいの負荷がかかるとかわかるでしょ?
そこに、信頼性や要求なんかを加味して
そこから逆算してくださいな
ってことです
そう言えば、昔「ディレクトリ型はロボット型の対義語じゃない」って怒られたっけ
思い出しちゃった
214nobodyさん
2005/05/24(火) 18:49:33ID:??? >>213
かなり遅レスで悪いけど、ローカルだと所詮LAN内だから
実際の処理スピードなんて測れ無くないか?
それよりも”100万件”というのが、普通のディレクトリ型の
検索エンジンで可能なのだろうか?ある意味100万件
ジャンル別に集められる検索エンジンがあれば
そこそこ利用してもらえる気がする。
かなり遅レスで悪いけど、ローカルだと所詮LAN内だから
実際の処理スピードなんて測れ無くないか?
それよりも”100万件”というのが、普通のディレクトリ型の
検索エンジンで可能なのだろうか?ある意味100万件
ジャンル別に集められる検索エンジンがあれば
そこそこ利用してもらえる気がする。
215nobodyさん
2005/05/24(火) 23:12:25ID:???216nobodyさん
2005/05/25(水) 16:09:44ID:??? yahoo.co.jpでもカテゴリの登録数は100万行ってないはず。
30万ぐらいじゃなかったか?
30万ぐらいじゃなかったか?
217nobodyさん
2005/05/25(水) 21:56:46ID:??? Yahoo!の検索ビジネス戦略を探る
ttp://internet.watch.impress.co.jp/static/column/yst/2004/12/03/
> 今現在登録されているサイトの総数は40万件以上になっています。
ttp://internet.watch.impress.co.jp/static/column/yst/2004/12/03/
> 今現在登録されているサイトの総数は40万件以上になっています。
218nobodyさん
2005/05/26(木) 07:37:23ID:??? 100万件あればソコソコどころじゃないって事かw
219nobodyさん
2005/05/28(土) 03:56:25ID:??? よし、とりあえず真面目に話すか。
100万件がどうのという話をしているが、それは=ディレクトリ型
というわけだろ?その時点でどういう検索エンジンであったとしても
二番煎じな気がする。
けど、ネットを利用してみて「欲しい情報を手に入れたい」と
思う人は多いわけで、だからこそ検索エンジンが使われるわけだ。
YAHOO!は知名度で成り立っているから、検索機能としては凄いわけではない。
Googleは莫大な情報量で成り立っているが、逆に言うと多すぎて
色々とみないと欲しい情報を得ることが出来ない。
この2つの点を回避出来たら、システム的にはそんなに大きくなくても
そこそこ利用される検索エンジンが出来ると思う。どうだろう?
100万件がどうのという話をしているが、それは=ディレクトリ型
というわけだろ?その時点でどういう検索エンジンであったとしても
二番煎じな気がする。
けど、ネットを利用してみて「欲しい情報を手に入れたい」と
思う人は多いわけで、だからこそ検索エンジンが使われるわけだ。
YAHOO!は知名度で成り立っているから、検索機能としては凄いわけではない。
Googleは莫大な情報量で成り立っているが、逆に言うと多すぎて
色々とみないと欲しい情報を得ることが出来ない。
この2つの点を回避出来たら、システム的にはそんなに大きくなくても
そこそこ利用される検索エンジンが出来ると思う。どうだろう?
220nobodyさん
2005/05/28(土) 14:02:50ID:??? どんなものを必要とするか分からない以上、
回避するには更に莫大な情報が必要ですよ。
回避するには更に莫大な情報が必要ですよ。
221nobodyさん
2005/05/28(土) 17:11:12ID:??? >>220
じゃ、とりあえず「何を必要とするか」を出していけば
自ずとまとまってくるんじゃないか?一人一つでも出せれば。
俺は「見づらいサイトを排除して欲しいor見やすさ重視」
色のカラーバランスや文字組みの構成を認識して
それによって順位が変動する検索表示だと良いかなって思ってる。
例えば、マイナーワードで古くからあるサイトとか
いくら上位表示されていても背景と文字のバランスがバラバラで
見づらいから、どこに情報があるかわからない。余計に探すのに
時間がかかってしまう。
じゃ、とりあえず「何を必要とするか」を出していけば
自ずとまとまってくるんじゃないか?一人一つでも出せれば。
俺は「見づらいサイトを排除して欲しいor見やすさ重視」
色のカラーバランスや文字組みの構成を認識して
それによって順位が変動する検索表示だと良いかなって思ってる。
例えば、マイナーワードで古くからあるサイトとか
いくら上位表示されていても背景と文字のバランスがバラバラで
見づらいから、どこに情報があるかわからない。余計に探すのに
時間がかかってしまう。
222nobodyさん
2005/05/30(月) 11:04:58ID:??? >221のアプローチだとyahooにもgoogleの既存システムの弱点回避を
導くよりは、gooラボで研究されて、下手すると実運用してないくせに
特許だけとられてがんじがらめにされてるようなアイデアを出しそうだ。
gooラボでのテーマや成果をみていると。
検索エンジンへの欲求は情報の鮮度と、アクセシビリティにつきると思う。
あとはパーソナライズね。鮮度を保証するために、機械で膨大なサンプルを網羅して
後は統計で個人ごとに異なる要求に応えるか、検索とは違うけどallAboutみたいに
権威者にディレクトリを維持させるというアプローチ自体は合理的な手段の
2極を極めていると思う。
強いて回避する方法があるとしたら、「何をソースに」「どういう重み付けをするか」
というロジックで差別化すること。前述の2極を意識するとSNSとかblogとか
すでに人が集めてディレクトリが出来ている情報から何を抽出するかだよね。
それは他の企業も取り組んでいる(需要が見越せる)けど完全な形が出ていない所。
一般的に「一次情報はどこか」に比重が置かれることが多いけど、
「次にくる」とか「以前きた」とか、情報が作り出したルートを図式化みたく
マクロ的な結論をどう出すか、というのはいくらでも研究の余地はあるらしい。
成功例が少ないけどw
導くよりは、gooラボで研究されて、下手すると実運用してないくせに
特許だけとられてがんじがらめにされてるようなアイデアを出しそうだ。
gooラボでのテーマや成果をみていると。
検索エンジンへの欲求は情報の鮮度と、アクセシビリティにつきると思う。
あとはパーソナライズね。鮮度を保証するために、機械で膨大なサンプルを網羅して
後は統計で個人ごとに異なる要求に応えるか、検索とは違うけどallAboutみたいに
権威者にディレクトリを維持させるというアプローチ自体は合理的な手段の
2極を極めていると思う。
強いて回避する方法があるとしたら、「何をソースに」「どういう重み付けをするか」
というロジックで差別化すること。前述の2極を意識するとSNSとかblogとか
すでに人が集めてディレクトリが出来ている情報から何を抽出するかだよね。
それは他の企業も取り組んでいる(需要が見越せる)けど完全な形が出ていない所。
一般的に「一次情報はどこか」に比重が置かれることが多いけど、
「次にくる」とか「以前きた」とか、情報が作り出したルートを図式化みたく
マクロ的な結論をどう出すか、というのはいくらでも研究の余地はあるらしい。
成功例が少ないけどw
223nobodyさん
2005/06/01(水) 06:19:53ID:??? >>222
すまん、また書くのが遅れた。
gooラボを出しているが、あれ自体が物凄く重くないか?
また、何かソフト入れなきゃ駄目だったろ。確か。
だから色物扱いされて、反響無かったと思うが。
あと、君は俺の1案に対してつっこみを入れているだけで
「自分が欲しい意見」というのを出していない気がするが。
単に既存のシステムを分析して批評しているだけで
開発のアイディアを出していない。
そういうの出さないと。
すまん、また書くのが遅れた。
gooラボを出しているが、あれ自体が物凄く重くないか?
また、何かソフト入れなきゃ駄目だったろ。確か。
だから色物扱いされて、反響無かったと思うが。
あと、君は俺の1案に対してつっこみを入れているだけで
「自分が欲しい意見」というのを出していない気がするが。
単に既存のシステムを分析して批評しているだけで
開発のアイディアを出していない。
そういうの出さないと。
224nobodyさん
2005/06/01(水) 06:22:44ID:??? それと企業的な観点からものを言いすぎる。
この板の特質上、あくまで個人のプログラマーが
検索エンジンを作る上で、どのような検索エンジンだと
反響があるのだろうか?使いやすいだろうか?
と言うことを話し合うスレだと思うが。
いわば開発アイディアの検証だ。
そうじゃなくて222のような企業的思考で難しいこと言ってても
誰も「検索エンジン作ろう」と思わないって。
この板の特質上、あくまで個人のプログラマーが
検索エンジンを作る上で、どのような検索エンジンだと
反響があるのだろうか?使いやすいだろうか?
と言うことを話し合うスレだと思うが。
いわば開発アイディアの検証だ。
そうじゃなくて222のような企業的思考で難しいこと言ってても
誰も「検索エンジン作ろう」と思わないって。
225nobodyさん
2005/06/01(水) 15:23:03ID:??? で、お前は批判しかしないんだな。
どうせ自覚も無いんだろ。口だけなんだから素直にバイトでも探してろ。
どうせ自覚も無いんだろ。口だけなんだから素直にバイトでも探してろ。
227nobodyさん
2005/06/01(水) 18:56:17ID:??? バイト探しの方が100倍建設的だろうが。脳味噌膿んでんのか?
229nobodyさん
2005/06/01(水) 19:04:14ID:??? おいおい、もうオウム返しかよw 早すぎww
231nobodyさん
2005/06/03(金) 19:34:02ID:vAHoocN8 要はブレストの段階で議論を始めると話が進まないという事かね。
つー訳で、とりあえずドンドンと意見を出して行こうぜ。素人考えだろうが
何だろうが、まずは案を挙げまくって、それから議論という事だ。
非アダルトの情報を欲して検索をかけても、アダルトの類のページが
検索にかかる割合が高い。オプション指定するだけで、キレイに検索から
アダルトを排除できる仕組みが欲しい。
逆に、アダルト検索用のオプションも欲しい。アダルトを検索にかけようと
思っても、検索にかかるアダルトサイトは殆どがクリックで目当ての小銭稼ぎ
サイトなのが現状だ。
検索の精度や抽出されるページの量を落とさずに、これらを実現できれば
嬉しい。ぬるぽ。
つー訳で、とりあえずドンドンと意見を出して行こうぜ。素人考えだろうが
何だろうが、まずは案を挙げまくって、それから議論という事だ。
非アダルトの情報を欲して検索をかけても、アダルトの類のページが
検索にかかる割合が高い。オプション指定するだけで、キレイに検索から
アダルトを排除できる仕組みが欲しい。
逆に、アダルト検索用のオプションも欲しい。アダルトを検索にかけようと
思っても、検索にかかるアダルトサイトは殆どがクリックで目当ての小銭稼ぎ
サイトなのが現状だ。
検索の精度や抽出されるページの量を落とさずに、これらを実現できれば
嬉しい。ぬるぽ。
232nobodyさん
NGNG 逆に、アダルトを主体的にデータ化していき、
そこにない差分データはとりあえず非アダルトということに
そこにない差分データはとりあえず非アダルトということに
233nobodyさん
2005/06/05(日) 09:34:25ID:??? >>231-232
とりあえず、俺はこの板に来たらなんか書くようにするから
他のみんなもどんどん意見を出して欲しいと思う。
んで、231の方法はmetaとかページのテキストから
アダルト関連のワードを拾うことで、アダルトサイトを
ほぼ完全排除出来ないかな?
最近のサイト制作の傾向として、1つの検索エンジンのみを
対象とした作り方はしないし、どうせYAHOO!やGoogle相手
なんだから、アダルトサイトがアダルト関連のキーワードを
はずせないし。なら、それらのキーワードを禁止指定すると
割と容易にアダルトサイトは排除出来ると思う。
とりあえず、俺はこの板に来たらなんか書くようにするから
他のみんなもどんどん意見を出して欲しいと思う。
んで、231の方法はmetaとかページのテキストから
アダルト関連のワードを拾うことで、アダルトサイトを
ほぼ完全排除出来ないかな?
最近のサイト制作の傾向として、1つの検索エンジンのみを
対象とした作り方はしないし、どうせYAHOO!やGoogle相手
なんだから、アダルトサイトがアダルト関連のキーワードを
はずせないし。なら、それらのキーワードを禁止指定すると
割と容易にアダルトサイトは排除出来ると思う。
234nobodyさん
2005/06/05(日) 09:38:35ID:??? それで次のアイディアだけど、よくあるかもしれないが
それでいて大手検索エンジンで使われていないのだが
ランダム検索と、ソート機能ってあれば面白いと思う。
ランダム検索機能はテキストボックスにキーワードを入れて
「ランダム検索」のボタンをクリックすると、ランダムな
検索結果を表示する。これで下位に埋もれるサイトを
見られる可能性が増える。
次にソート機能は主にタイトルからソートをかける機能。
タイトル以外にも登録日・更新日を昇順・降順出来ることで
タイムリーな記事やサイトを表示させることが出来る。
上記の2機能はディレクトリ型の検索エンジンでも
割と容易に出来る気がする。けど、あまり見かけない。
それでいて大手検索エンジンで使われていないのだが
ランダム検索と、ソート機能ってあれば面白いと思う。
ランダム検索機能はテキストボックスにキーワードを入れて
「ランダム検索」のボタンをクリックすると、ランダムな
検索結果を表示する。これで下位に埋もれるサイトを
見られる可能性が増える。
次にソート機能は主にタイトルからソートをかける機能。
タイトル以外にも登録日・更新日を昇順・降順出来ることで
タイムリーな記事やサイトを表示させることが出来る。
上記の2機能はディレクトリ型の検索エンジンでも
割と容易に出来る気がする。けど、あまり見かけない。
235nobodyさん
2005/06/05(日) 10:29:47ID:??? >>233
まぁ、言っていることは妥当だと思われ
ただ、問題なのはどうやってアダルト関連のキーワードを判断するかだね
人手で作ってちゃ馬鹿だし
ベイジアンフィルタなんてのもあるから
その応用なんだろうけど
まぁ、言っていることは妥当だと思われ
ただ、問題なのはどうやってアダルト関連のキーワードを判断するかだね
人手で作ってちゃ馬鹿だし
ベイジアンフィルタなんてのもあるから
その応用なんだろうけど
236nobodyさん
2005/06/05(日) 16:15:38ID:??? >>235
アダルト関連のワードってめちゃくちゃ細かいのも排除するの?
例えば、AV女優の名前とか。
とりあえず、「アダルト」「風俗」「AV」とかそういうおなじみの
ワードを省くだけで良いと思う。管理者が入力するタイプでも。
アダルト関連のワードってめちゃくちゃ細かいのも排除するの?
例えば、AV女優の名前とか。
とりあえず、「アダルト」「風俗」「AV」とかそういうおなじみの
ワードを省くだけで良いと思う。管理者が入力するタイプでも。
237nobodyさん
2005/06/05(日) 22:44:18ID:??? >>236
っていうか、どこまでをアダルトと認識するかによって異なる
例えば、アダルト:アダルトチルドレンなんて様に
特定のキーワードを含む=アダルトサイト
ってわけにはいかないからね
子供向けのフィルタを作る or 特定の分野に特化する
なら話は違ってくるけどさ
ベイジアンフィルタ=めちゃめちゃ細かいものを排除する
って言うわけではないってことね
っていうか、どこまでをアダルトと認識するかによって異なる
例えば、アダルト:アダルトチルドレンなんて様に
特定のキーワードを含む=アダルトサイト
ってわけにはいかないからね
子供向けのフィルタを作る or 特定の分野に特化する
なら話は違ってくるけどさ
ベイジアンフィルタ=めちゃめちゃ細かいものを排除する
って言うわけではないってことね
238nobodyさん
2005/06/06(月) 00:20:28ID:??? >>237
そう言われればそうだよね。AVでもAV機器ってあるしな・・。
とりあえず、+で含まれるワードはどうだろ?
「ホームページ」「制作」でホームページ制作をフィルタするように
「アダルト」+「AV女優」とか加えてフィルタにするとか。
でも、なかなか難しそうだな。なんか騙しリンクとか
そういうのを完全排除出来る、フィルタリング対応検索エンジン
があれば、割と受けると思うんだけどな。
そう言われればそうだよね。AVでもAV機器ってあるしな・・。
とりあえず、+で含まれるワードはどうだろ?
「ホームページ」「制作」でホームページ制作をフィルタするように
「アダルト」+「AV女優」とか加えてフィルタにするとか。
でも、なかなか難しそうだな。なんか騙しリンクとか
そういうのを完全排除出来る、フィルタリング対応検索エンジン
があれば、割と受けると思うんだけどな。
239nobodyさん
2005/06/06(月) 12:46:54ID:???240nobodyさん
2005/06/06(月) 16:24:02ID:??? とりあえず2ch.netも全カットだなw
241nobodyさん
2005/06/07(火) 22:37:09ID:???242nobodyさん
2005/06/13(月) 04:28:42ID:??? スレが進んでるのにびっくりした。
>>223-224
企業的視点であり、自分の意見の欲しい形を言ってないとの事だが、
そうではなく企業ですでに目をつけてるものをやっても仕方ない
と思う反面で、企業体が研究している分野を否定して需要がない所を
掘り込むのもどうかと思う(企業的規模で成功するためにじゃなく、
使ってもらってフィードバックしてもらうってレベルでね)から、
注目されてる一例を出しただけであって、深いとか難しいと思わなかった。
企業的視点と読み取るのは、単語に騙されやすいのではないかと。
で、そこから「何をソースに」「どういう重み付けをするか」 について特色を
出したものが欲しいなってのが俺の意見なわけで、述べてないと読み取るのは
最初から述べて欲しい意見を想定していて、プロテクトしちゃってるから
読み取れないんじゃないだろうか。まあ、俺も>1が01年のスレで一気に具体案まで
提案するのはどうかと、大ざっぱな概念から振ったのは不親切だったと思う。
>231-233で、まずはブレストって事で決着しているが、とりあえずなにやら
へんな読み取られ方してると思ったので訂正しておきたい。
アダルト情報の排除か、それを極めると逆にアダルトの検索エンジンのコア
としても機能しそうだね。ただ、運用したらお役所に睨まれそうだがw
アダルト、アドウェアみたいなデータからNOTで弾くために、エロボットは
必要なのかも知れないな。
>>223-224
企業的視点であり、自分の意見の欲しい形を言ってないとの事だが、
そうではなく企業ですでに目をつけてるものをやっても仕方ない
と思う反面で、企業体が研究している分野を否定して需要がない所を
掘り込むのもどうかと思う(企業的規模で成功するためにじゃなく、
使ってもらってフィードバックしてもらうってレベルでね)から、
注目されてる一例を出しただけであって、深いとか難しいと思わなかった。
企業的視点と読み取るのは、単語に騙されやすいのではないかと。
で、そこから「何をソースに」「どういう重み付けをするか」 について特色を
出したものが欲しいなってのが俺の意見なわけで、述べてないと読み取るのは
最初から述べて欲しい意見を想定していて、プロテクトしちゃってるから
読み取れないんじゃないだろうか。まあ、俺も>1が01年のスレで一気に具体案まで
提案するのはどうかと、大ざっぱな概念から振ったのは不親切だったと思う。
>231-233で、まずはブレストって事で決着しているが、とりあえずなにやら
へんな読み取られ方してると思ったので訂正しておきたい。
アダルト情報の排除か、それを極めると逆にアダルトの検索エンジンのコア
としても機能しそうだね。ただ、運用したらお役所に睨まれそうだがw
アダルト、アドウェアみたいなデータからNOTで弾くために、エロボットは
必要なのかも知れないな。
244nobodyさん
2005/06/15(水) 03:24:42ID:??? みんなに謝らなきゃいけないことがある。
このスレのタイトルを見たとき俺は、、、、、、、
検索ニンジンをつくりたい
かと思ってしまったんだ。すまない。
このスレのタイトルを見たとき俺は、、、、、、、
検索ニンジンをつくりたい
かと思ってしまったんだ。すまない。
245nobodyさん
2005/06/15(水) 03:46:17ID:??? 絶対に許さない
246nobodyさん
2005/06/15(水) 06:28:52ID:??? 検索エンジンにオークション的機能があっても面白いかも。
248nobodyさん
2005/06/15(水) 19:00:23ID:SDEIoMgZ 俺データベースが苦手で
エクセルのCSVを多様して検索システムをつくった
いまんとこ1000件データをいれてためしたが
結構早く検索する・・どれぐらいたえれるのだろうか・・・・
データベース俺のまえにたちはだかってやがる・・・
ショップサイトも検索サイトもすべてCSVで処理してる俺は首すんぜんだろうか・・・
エクセルのCSVを多様して検索システムをつくった
いまんとこ1000件データをいれてためしたが
結構早く検索する・・どれぐらいたえれるのだろうか・・・・
データベース俺のまえにたちはだかってやがる・・・
ショップサイトも検索サイトもすべてCSVで処理してる俺は首すんぜんだろうか・・・
249nobodyさん
2005/06/15(水) 22:08:01ID:???250nobodyさん
2006/11/11(土) 21:19:03ID:??? 緊急浮上!
○_○
( ・(ェ)・) < 天然記念スレをまもれ!
/つ¶つ ¶
/ ̄ ̄ ̄ ̄ ̄ ̄ヽ //
人人 / ● ●、 ザバァ!!
/ 〇 ▼ l 人人人
/ = , 、_ _人_ノヾ
人人 ノ 人人
人人人 人人
○_○
( ・(ェ)・) < 天然記念スレをまもれ!
/つ¶つ ¶
/ ̄ ̄ ̄ ̄ ̄ ̄ヽ //
人人 / ● ●、 ザバァ!!
/ 〇 ▼ l 人人人
/ = , 、_ _人_ノヾ
人人 ノ 人人
人人人 人人
251nobodyさん
2006/12/01(金) 22:51:13ID:??? Googleの検索コマンドを使いこなせば、
このスレに出てるほとんどのアイディアが実現できる気がする。
このスレに出てるほとんどのアイディアが実現できる気がする。
252たま
2007/02/02(金) 10:45:34ID:QBCmJWsF検索エンジンのPHPスクリプトを配布しているところを探しています。
どなたかご存じでしょうか??
宜しくお願い致します。
253nobodyさん
2007/02/02(金) 11:27:23ID:??? yomi php
で検索しろ
で検索しろ
254 ◆hb//x7qyug
2007/02/02(金) 12:12:18ID:DuFcC87D >>1
おもしろそう。協力しようか?
おもしろそう。協力しようか?
256nobodyさん
2007/02/07(水) 08:59:32ID:CGn0u8gT おまえらquery文字のパースってDBと連携してどうやってる?
googleライクに
"unko unko" -hogehoge (aaaa or "cc cc")
みたいなの
googleライクに
"unko unko" -hogehoge (aaaa or "cc cc")
みたいなの
257nobodyさん
2007/02/08(木) 09:24:06ID:??? 実験でbisonで作ったパーサをモジュールの形でPHPに組み込んだことあるよ。
...めんどくさいけどね。でもPHPでパーサを書く場合でも.yの書き方は参考になる。
RubyならRacc
...めんどくさいけどね。でもPHPでパーサを書く場合でも.yの書き方は参考になる。
RubyならRacc
258nobodyさん
2007/02/13(火) 02:21:01ID:??? ロボット検索自体を避けるように仕込んでなければ片っ端からサイトを拾ってくれるような
お行儀の悪い検索エンジンを使いたいです。
お行儀の悪い検索エンジンを使いたいです。
259nobodyさん
2007/02/20(火) 18:20:31ID:??? ファイルを読み込んだ時にJavwScriptのコードを除外するいい方法はないですか?
フィルターとかあれば良いんですけど・・
フィルターとかあれば良いんですけど・・
260nobodyさん
2007/10/31(水) 21:21:23ID:nkFoGGXY 259は新開発したか
261nobodyさん
2007/11/07(水) 06:37:03ID:??? s/\<script.*\/script\>//gi;
262ギニア3世
2007/11/16(金) 21:23:24ID:idEdN7T0 グーグルよりすごい?検索エンジン
http://www.quintura.com/
http://www.quintura.com/
263nobodyさん
2008/06/08(日) 13:47:25ID:oe9fgjbi 2003年から工藤智行氏が開発を続けている検索エンジン「FINDSPOT」
http://21news.cocolog-nifty.com/blog/2008/05/post_d828.html
連載:検索エンジンを作る|gihyo.jp … 技術評論社
http://gihyo.jp/dev/serial/01/make-findspot
http://21news.cocolog-nifty.com/blog/2008/05/post_d828.html
連載:検索エンジンを作る|gihyo.jp … 技術評論社
http://gihyo.jp/dev/serial/01/make-findspot
264nobodyさん
2008/06/24(火) 02:01:34ID:iHrl1LSI >>5 バロスww
265nobodyさん
2008/06/27(金) 00:50:18ID:gBJjjQVQ266nobodyさん
2008/12/07(日) 23:00:34ID:WE1pXcYe マーズフラグってなかなかいいかも
http://www.marsflag.com/
http://www.marsflag.com/
267nobodyさん
2008/12/20(土) 23:38:56ID:WN7kdZGE ttp://www.kokoni.com/
268nobodyさん
2008/12/22(月) 00:27:02ID:9ZqbUAej eltg33.no-ip.info
anonymouse:0123456789
Search script配布
anonymouse:0123456789
Search script配布
2008/12/31(水) 16:10:58ID:???
検索結果にサムネを出すってアイデアも前スレにありましたが・・・
どうでしょう?
どうでしょう?
270nobodyさん
2008/12/31(水) 22:33:26ID:MitumZi6 東京大学うぜーよ!!!!
てめーの研究室がクロールされろ!!!
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
てめーの研究室がクロールされろ!!!
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
271nobodyさん
2008/12/31(水) 23:04:32ID:??? 池■田大■作の本名はソン・テチャク。小泉純一郎、小沢一朗は朝鮮人。
911では小型の水爆が使用されている。
http://ri■ch■ardkosh■im■izu.at.webry.info/
創価の保険金殺人事件。
オウム事件は、統一・創価.北朝鮮の共同犯行である。CIAが監修している。
http://www15.ocn.ne.jp/~oy■ako■don/kok_web■site/ir■iguc■hi.htm
与党も野党もメディアも全部朝鮮人だった。
http://jb■bs.li■vedo■or.jp/b■bs/read.cgi/news/20■92/115794■1306/
2ちゃんねるは統一■教会が個人情報を集めるための道具。運営には統一■教会がいる。
駅前で「手相を見せてください」と勧誘してるのが統一教■会。(カルト宗教)
カルト宗教の下にいる人と上にいる奴を分けて考えないといけない。下にいる利用される人は上がどんなことをしてるか知らない。
ユダヤ権力の子分→2ちゃん運営=統一協会上層部=層化上層部=自民党清和会=野党の朝鮮人ハーフの政治家=
与党の朝鮮人ハーフの政治家=金 正日(キム・ジョンイル )=読売サンケイ=小沢十朗
ユダヤ人=ロックフェラー=ブッシュ=クリントン=ヒラリー=アドルフ・ヒトラー=オサマ・ビンラディン
毎日新聞スレを荒らしてる奴らも統■一教会の可能性が高い。
荒らしは洗脳するために「ネトウヨ」などのレッテル付けレスを何千回もする。
現実には「ネトウヨ」などは存在しない。
http://changi.2ch.net/test/read.cgi/ms/1230363385/
911では小型の水爆が使用されている。
http://ri■ch■ardkosh■im■izu.at.webry.info/
創価の保険金殺人事件。
オウム事件は、統一・創価.北朝鮮の共同犯行である。CIAが監修している。
http://www15.ocn.ne.jp/~oy■ako■don/kok_web■site/ir■iguc■hi.htm
与党も野党もメディアも全部朝鮮人だった。
http://jb■bs.li■vedo■or.jp/b■bs/read.cgi/news/20■92/115794■1306/
2ちゃんねるは統一■教会が個人情報を集めるための道具。運営には統一■教会がいる。
駅前で「手相を見せてください」と勧誘してるのが統一教■会。(カルト宗教)
カルト宗教の下にいる人と上にいる奴を分けて考えないといけない。下にいる利用される人は上がどんなことをしてるか知らない。
ユダヤ権力の子分→2ちゃん運営=統一協会上層部=層化上層部=自民党清和会=野党の朝鮮人ハーフの政治家=
与党の朝鮮人ハーフの政治家=金 正日(キム・ジョンイル )=読売サンケイ=小沢十朗
ユダヤ人=ロックフェラー=ブッシュ=クリントン=ヒラリー=アドルフ・ヒトラー=オサマ・ビンラディン
毎日新聞スレを荒らしてる奴らも統■一教会の可能性が高い。
荒らしは洗脳するために「ネトウヨ」などのレッテル付けレスを何千回もする。
現実には「ネトウヨ」などは存在しない。
http://changi.2ch.net/test/read.cgi/ms/1230363385/
274名無しさん
2011/10/13(木) 00:52:05.66ID:/EgVNFsq 取り越し苦労
レスを投稿する
ニュース
- 【実況】サッカーW杯・決勝トーナメント1回戦『日本 vs ブラジル』 フジ系 2:00~ [冬月記者★]
- 【サッカー】「1度寝る?起きておく?」 日本vsブラジルで議論勃発! 午前2時開始…「延長やPK戦までもつれたら朝までの戦いに」★2 [冬月記者★]
- 【サッカー】日本代表・塩貝健人のSNS炎上…人種差別的な攻撃の標的に ブラジルメディアは擁護「元の発言より過激に伝えられている」 [冬月記者★]
- 亀梨和也が田中みな実と結婚発表 妊娠も「新しい命も授かっています」ファンクラブサイトで ★6 [首都圏の虎★]
- 新卒一括採用はオワコンか 強まる即戦力志向、中途比率は5割超え [どどん★]
- 【為替】円39年半ぶり安値、一時161円97銭 ドル買い圧力強く [蚤の市★]
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★242【メキシコ/カナダ/アメリカ】
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★240【メキシコ/カナダ/アメリカ】
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★240【メキシコ/カナダ/アメリカ】
- 【マターリ】日本vsブラジル ★1
- 【ATP】テニス総合実況スレ2026 Part 68【WTA】
- 【DAZN専用】ブラジル-日本 ★1
- 日本vsブラジル★2 [903775116]
- 日本vsブラジル★3 [903775116]
- 【フジ/NHK-BS/DAZN】FIFAワールドカップ2026 日本vsブラジル★2
- 日本vsブラジル★1 [903775116]
- 【フジ/NHK-BS/DAZN】FIFAワールドカップ2026 日本vsブラジル★2
- 【フジ/NHK-BS/DAZN】FIFAワールドカップ2026 日本vsブラジル★1